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OM nucleic - nucleic search, using sw model 



Run on: 



June 25, 2004, 06:11:13 ; Search time 6340.47 Seconds 

(without alignments) 
13027.239 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-10-054-680-1 
2766 

1 atggcgtggttaaggttgca gctacatcaaggggttctaa 27 66 



Scoring table: 



IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



27513289 seqs, 14931090276 residues 



Total number of hits satisfying chosen parameters: 



55026578 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database 
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em__estba : * 
em_esthum: * 
em_estin: * 
em__estmu: * 
em_estov: * 
em_estpl : * 
em_estro: * 
em_htc : * 
gb_estl : * 
gb_est2 : * 
gb_htc: * 
gb_est3:* 
gb_est4 : * 
gb__est5: * 
em_estfun : * 
em__estom: * 
em_gss_hum: * 
em_gss_inv: * 
em_gss_pln: * 
em__gss_vrt : * 
em_gss_fun: * 
em_gss_mam: * 
em__gss_mus : * 
em__gss_pro : * 
em__gss_rod: * 
em_gss_phg: * 
ern_gss_vrl : * 



28: gb_gssl:* 
29: gb_gss2:* 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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RESULT 1 
BC036783 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



REMARK 
COMMENT 



BC036783 3186 bp mRNA linear HTC 19-NOV-2003 

Homo sapiens solute carrier family 8 (sodium- calcium exchanger) , 
member 3, mRNA (cDNA clone IMAGE: 5732743) , with apparent retained 
intron. 
BC036783 

BC036783.1 GI: 23331089 
HTC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 3186) 

Strausberg, R. L. , Feingold, E. A. , Grouse, L.H. , Derge, J.G. , 
Klausner, R. D. , Collins , F. S . , Wagner, L., Shenmen, C .M. , Schuler, G. D. , 
Altschul, S . F. , Zeeberg,B., Buetow,K.H., Schaef er, C . F. , Bhat,N.K., 
Hopkins, R. F. , Jordan, H., Moore, T., Max,S.I., Wang, J., Hsieh,F., 
Diatchenko, L. , Marusina,K., Farmer, A. A. , Rubin, G.M., Hong,L., 
Stapleton,M. , Scares, M.B. , Bonaldo,M.F. , Casavant , T . L . , 
Scheetz, T. E. , Brownstein, M. J . , Usdin,T.B., Toshiyuki, S . , 
Carninci,P., Prange,C, Raha,S.S., Loquellano, N . A. , Peters, G. J., 
Abramson, R. D. , Mullahy, S . J. , Bosak, S . A. , McEwan, P. J. , 
McKernan, K. J. , Malek, J. A. , Gunaratne, P. H. , Richards, S . , 
Worley,K.C, Hale,S., Garcia, A.M. , Gay,L.J., Hulyk,S.W., 
Villalon, D. K. , Muzny, D.M. , Sodergren, E . J. , Lu,X., Gibbs,R.A., 
Fahey,J., Helton, E., Ketteman,M., Madan,A., Rodrigues , S . , 
Sanchez, A., Whiting, M. , Madan,A., Young, A. C, Shevchenko, Y . , 
Bouf f ard, G. G. , Blakesley, R.W. , Touchman, J. W. , Green, E.D., 
Dickson, M. C. , Rodriguez, A. C. , Grimwood, J . , Schmutz,J., Myers, R.M., 
Butter f ield, Y. S. , Krzywinski,M. I . , Skalska,U. , Smailus, D. E. , 
Schnerch,A., Schein,J.E., Jones, S.J. and Marra,M.A. 
Generation and initial analysis of more than 15,000 full-length 
human and mouse cDNA sequences 

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) 

22388257 

12477932 

2 (bases 1 to 3186) 
Strausberg, R. 
Direct Submission 

Submitted (23-AUG-2002 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 
Contact: MGC help desk 
Email : cgapbs-r@mail . nih . gov 
Tissue Procurement: Invitrogen 

cDNA Library Preparation: Life Technologies, Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: National Institutes of Health Intramural 
Sequencing Center (NISC) , 



Gaithersburg, Maryland; 

Web site: http://www.nisc.nih.gov/ 

Contact: nisc_mgc@nhgri.nih.gov 

Akhter, N. , Ayele, K. , Beckstrom-Sternberg, S .M. , Benjamin, B. , 
Blakesley, R.W. , Bouf f ard, G . G . , Breen,K., Brinkley,C, Brooks, S., 
Dietrich, N. L. , Granite, S., Guan,X., Gupta, J., Haghighi,P., 
Hansen, N., Ho,S.-L., Karlins,E., Kwong,P., Laric,P., Legaspi,R., 
Maduro,Q.L. , Masiello,C. , Maskeri,B. , Mastrian, S . D. ,McCloskey, J. C . , 
McDowell, J., Pearson, R. , Stantripop, S . , Thomas, P. J., Touchman, J. W . , 
Tsurgeon,C, Vogt,J.L., Walker, M. A., Wetherby, K. D . , Wiggins, L., 
Young, A., Zhang, L.-H. and Green, E. D. 

Clone distribution: MGC clone distribution information can be found 
through the I. M- A. G.E. Consortium/ LLNL at: http://image.llnl.gov 
Series: IRAK Plate: 79 Row: j Column: 21 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 17865803 
This clone has the following problem: retained intron. 
FEATURES Location/Qualifiers 
source 1. .3186 

/organism="Homo sapiens " 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/clone="IMAGE: 5732743" 

/tissue_type="Brain, hippocampus " 

/ clone_l ib= "NI H_MGC_1 24" 

/lab_host="DH10B" 

/note="Vector: pCMV-SP0RT6" 

ORIGIN 

Query Match 95.0%; Score 2627.4; DB 11; Length 3186; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2628; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 558 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 617 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 618 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 677 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 678 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 737 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 738 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAG 797 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 798 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 857 



Qy 

Db 



301 T CT AT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
858 T CT ATT GAAGT CAT C AC CT CTCAAGAGAGGGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 917 



Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I 
Db 918 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 977 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 978 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1037 

Qy 481 ATT GCT GGTGAT CT GGGAC CT T CT AC CATT GT AGG GAGT GCAGCCT T CAACAT GTT CAT C 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1038 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 1097 

Qy 541 AT CAT TGGCAT CT GT GT CT AC GT GAT C CCAGAC GGAGAGACT CGCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1098 AT CATTGGCATCTGT GTCTACGT GATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 1157 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1158 C GAGT CTT CTT CAT C AC CGCTGCTTG GAGT AT CTT T GCCTACATCT GGCT CTAT AT GAT T 1217 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1218 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1277 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1278 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1337 

Qy 781 ATGCACAAAAAGT ACCGCACAGACAAACACC GAGGAATTATCATAGAGACAGAGGGT GAC 840 

I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1338 AT GCACAAAAAGT AC C GC ACAGACAAACAC C GAGGAATTAT CATAGAGACAGAGGGT GAC 1397 

Qy 841 CAC CCTAAGGG CATT GAGAT GGAT GGGAAAAT GAT GAAT T CCCATT T T CTAGAT GGGAAC 900 

I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1398 CACCCTAAGGGCATT GAGATGGATGGGAAAAT GATGAATTCCCATTTT CTAGATGGGAAC 14 57 

Qy 901 CT GGTGCCCCTGGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT CCGGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1458 CT GGTGCC CCT GGAAGGGAAG GAAGT GGAT GAGT C C C GC AGAGAGAT GAT C C GGATT CT C 1517 

Qy 961 AAGGAT CT GAAGCAAAAACAC C C AGAGAAG GACTT AGAT C AGCT G GT G GAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1518 AAGGAT CT GAAGCAAAAACAC C C AGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1577 

Qy 1021 TACT AT GCTCTTTCC CAC CAAC AGAAGAGC C GC GC CTTCT ACC GT AT C CAAGC CACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1578 T ACT AT GC T CT T T C C CAC CAAC AGAAGAGC C GC GC CT T CT ACC GT AT C CAAGC CACT C GT 1637 

Qy 1081 AT GATGACTGGTGCAGGCAAT AT CCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1638 AT GATGACTGGTGCAGGCAAT AT CCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1697 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1698 T C CAGCAT GAGCGAGGT GCACAC C GAT GAGC CT GAGGACTTTATTT CC AAGGT CT T CTT T 1757 
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Qy 
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Qy 
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Qy 
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Qy 
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Qy 
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Qy 
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Qy 
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Qy 
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Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 



1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1758 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1817 

1261 AAAGGGGGAGACATGTCAAAGACCAT GTAT GTGGACTACAAAACAGAGGATGGTT CTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1818 AAAGG G GGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAG GAT GGTT CTGC C 1877 

1321 AAT GC AG GGGCT GACT AT GAGTT CACAGAGGG C AC GGT G GTT CT GAAGC CAG GAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1878 AAT GCAGGGGCT GACT AT GAGT T C ACAGAG GGCAC GGT GGT T CT GAAGC CAGGAGAGAC C 1937 

1381 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I III II I II III I I Mill II II II I 

1938 CAGAAGGAGTTCTCCGT GGGCATAATTGAT GACGACATTTTT GAGGAGGATGAACACTTC 1997 

1441 T TT GTAAGGTT GAGCAAT GT CC GC AT AGAGGAGGAGCAGC C AGAGGAGGG GAT GC CTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I II I 
1998 TT T GTAAGGT T GAGCAAT GT CC GC AT AGAG GAGGAGC AGCCAGAGGAGGGGAT GC CTCCA 2057 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I II II I I I I I I I I I I I I I I I I II I I I I I I I II II I I II II I I II I I I I I I I I I I I I II I 
2058 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2117 

1561 GTTAC C AT CTT GGATGAT GACC AT GCAGGCAT CT T C ACTT TT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I II I I I I I I I I I II I I II I I I I I I II I 
2118 GTTAC CAT CT T GGATGAT GACC AT GCAGGCAT CT T CACTT TT GAAT GT GATACT ATTCAT 2177 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I 
2178 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2237 

1681 ACAGT CAT CGT CC C CTT T AGGACAGT AGAAGG GAC AGC CAAGGGT GGCGGTGAGGACTT T 1740 

I I I I I I I I I I I I I II I I I I I I II I I II II I I I I I I I I I I I I I I I I I I II I I I I I I I I II I 
2238 ACAGT CAT CGT C CC CTT T AGGACAGTAGAAGGGACAGCCAAGGGT GGC GGTGAGGACT T T 2297 

1741 GAAGAC AC AT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAACCATAAGGGTT 1800 

I I I I I II I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
2298 GAAGAC ACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAAC C ATAAGGGTT 2357 

1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CTT CAT TGCCCTTGGT GAA 1860 

I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I I I I 
2358 AAAAT AGT AGAT GAG GAG GAAT AC GAAAGGCAAGAGAAT TT CTT CAT TGCCCTTGGT GAA 2417 

1861 CCGAAAT GGATGGAACGTGGAATATCAGAT GTGACAGACAGGAAGCT GACTAT GGAAGAA 1920 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
2418 C C GAAAT GGAT GGAACGT GGAAT AT CAGAT GT GAC AGACAGGAAGCT GACTAT GGAAGAA 2477 

1921 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC C AGT AT T GGGT GAAC ACCC CAAACT A 1980 

I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
2478 GAGGAGGC CAAGAGGAT AGCAGAGAT G GGAAAGC CAGTAT T G GGT GAAC AC C C CAAACT A 2537 

1981 GAAGT CAT CAT T GAAGAGT C CT AT GAGT T CAAGACT AC GGT G GACAAACT GAT CAAGAAG 2040 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
2538 GAAGT CAT CAT T GAAGAGT C CT AT GAGTT CAAGACTAC GGT G GACAAACT GAT CAAGAAG 2597 

2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 



Db 



I I I I I I I I I I I I I I I I I II I I I I I II II I I I I II I I I I I I I I I I II I I II I I I I I I I I I I 
2598 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2657 



Qy 2101 ACCGT CAGT GCAGCAGGGGAT GAGGATGAGGAT GAAT CC GGGGAGGAGAGGCT GC C CT CC 2160 

I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 
Db 2658 ACC GT CAGT GCAG CAGGGGAT GAGGATGAGGAT GAAT C C GGGGAGGAGAGGCT GC C CT CC 2717 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2718 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2777 

Qy 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2778 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2837 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2838 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2897 

Qy 2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2898 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2957 

Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2958 AGCAAAGCT GCT GC C CT C C AGGAT GT AT AT GCAGAC GCCT C CAT T GGCAAC GT GAC GGGC 3017 

Qy 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3018 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 3077 

Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3078 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 3137 

Qy 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAA 2629 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3138 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAA 3186 
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Location/Qualifiers 

1. .1788 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
<1. .>1788 
/gene="SLC8A3" 
/locus_tag="HCM0839" 



ORIGIN 



Query Match 64.6%; 
Best Local Similarity 99.9%; 
Matches 1787; Conservative 



Score 1786.4; 
Pred. No. 0; 
0; Mismatches 



DB 29; Length 1788; 

1; Indels 0; Gaps 



Qy 

Db 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

121 ACAGGGC AGAACAAT GAGT CCT GT T CAG GGT CAT C GGACT G CAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 ACAGGGC AGAACAAT GAGT CCT GT T CAGGGT CAT C GGACT G CAAGGAGGGT GT CAT C CT G 180 

181 C CAAT CT GGTACC C GGAGAACCCT T CCCT T GGG GAC AAGAT T GC CAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I II I II I I I I I I 
181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 



Qy 

Db 

Qy 

Db 

Qy 

Db 



241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

301 T CT ATT GAAGT CAT CAC CT CT C AAGAGAGGGAGGT GACAAT T AAGAAAC CCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAAC CCAAT GGAGAA 360 

361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 



Qy 



421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 



I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I 1 I I I I I I I I I I I I I I I I I 
421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

4 81 ATT GCTGGT GAT CTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTT CATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 81 ATT GCT GGT GAT CT GGGAC CT T CT AC CAT T GT AGGGAGT G CAGC CT T CAACAT GT T CAT C 540 

541 ATCATTGGCATCT GT GT CTACGT GAT CCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 ATCATTGGCATCTGT GT CTACGT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCATCTA 600 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 AT GCACAAAAAGT AC CGC AC AGACAAACAC C GAGGAATT AT C AT AGAGACAGAGGGT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 AT GCACAAAAAGT AC CGCACAGACAAACACCGAG GAATT AT CAT AGAGACAGAGGGT GAC 840 

841 CACCCTAAGGGCATTGAGAT GGATGGGAAAATGAT GAATT CCCATTTT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 CAC C CT AAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAAT T CC CAT T TT CTAGAT GGGAAC 900 

901 CT GGT GC C C CTGGAAGGGAAGGAAGT GGAT GAGT C C C GC AGAGAGAT GAT C C GGAT T CTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CT GGT GC C C CTGGAAGGGAAG GAAGT G GAT GAGT CC C GCAGAGAGAT GAT C C GGAT T CTC 960 

961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGT GGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCT GGT GGAGATGGCCAAT 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC AT GCAGC AGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 ATGATGACT GGTGCAGGCAAT AT CCT GAAGAAAC AT GCAGC AGAACAAGC CAAGAAGGCC 1140 

1141 T C CAGCAT GAGCGAGGT GCAC AC C GAT GAGCCT GAGGACT T TAT T T C CAAGGTCTT CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T C CAGCAT GAGC GAGGT GC ACAC C GAT GAGC CT GAGGACT TT AT T T C CAAGGT CT T CTTT 1200 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 



Qy 1261 AAAGGGGGAGACAT GTCAAAGACCATGTATGTGGACT ACAAAACAGAGGATGGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I 



Db 



1261 



AAAGGGG GAGAC AT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 1320 



Qy 1321 AAT GCAGGGGCTGACT AT GAGTT CACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CTGAAGC C AGGAGAGAC C 1380 

Qy 1381 C AGAAGGAGT T CT C CGT GGGC ATAATT GAT GAC GACAT TTTT GAGGAGGAT GAAC ACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTT CTCCGTGGGCATAATTGAT GAC GACAT TTTT GAGGAGGAT GAACACTTC 1440 

Qy 1441 T TT GTAAGGTT GAGCAAT GT C CGCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT C C A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T T T GT AAGGT T GAGCAAT GT C CGCAT AGAG GAGGAGC AGC CAGAGGAGGGGAT GC CT C C A 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTT AC CAT CT T GGAT GAT GAC CAT GCAGGC AT CT T CACTTTT GAAT GT GATACTATTCAT 1620 

I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTACCAT CTT GGAT GAT GAC CATGCAGGCATCTTCACTTTT GAAT GTGATACTATTCAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

Qy 1681 AC AGT CAT C GT C CC CTTT AG GAC AGTAGAAGGGAC AGC CAAGGGT GG C GGTGAGGACTT T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 AC AGT CAT C GT C CC CTT T AG GAC AGT AGAAGGGACAG C CAAGGGT GGC GGT GAGGACTT T 1740 

Qy 1741 GAAGACACAT AT GGGGAGT T G GAAT T CAAGAAT GAT GAAACT GT GAAA 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1741 GAAGACACAT AT GGGGAGTT G GAATT CAAGAAT GAT GAAACT GT GTAA 1788 
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Location/Qualifiers 

1. .1788 

/organism="Pan troglodytes" 

/mol_type=" genomic DNA" 

/db_xref="taxon: 9598" 

<1. .>1788 

/gene="SLC8A3" 

/locus_tag="HCM0839" 



Query Match 63.0%; Score 1741.4; DB 29; Length 1788; 

Best Local Similarity 97.8%; Pred. No. 0; 

Matches 1748; Conservative 0; Mismatches 40; Indels 0; Gaps 



0; 



Qy 

Db 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I II II I I II I I I I II I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 TTTGTGCTCTTTCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

121 AC AGGGCAGAACAATGAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 AC AGGGCAGAACAATGAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 180 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



181 C CAAT CT GGT ACC C GGAGAACC CTT C CCTT GGGGACAAGAT T GC CAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCG 300 

301 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GAC GATTAAGAAAC C CAAT GGAGAA 360 

361 AC CAG C ACAAC CACTATT C GGGT CT G GAAT GAAACT GT CT C CAACCT GAC C CT T AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

361 AC CAGCACAACC ACT AT T C GAGT CT G GAAT GAAACT GT CT C CAACCT GAC CCTTAT GGC C 420 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 



Qy 



481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 



Db 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

Qy 541 ATCATTGGCATCTGT GTCTACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 541 AT CATT GG C AT CT GT GT CT ACGT GAT C C C AGACGGAGAGACT CGCAAGAT CAAG C AC CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I II I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGT AC C GCACAGACAAACAC C GAGGAATT ATC AT AGAGAC AGAGGGT GAC 840 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 781 AT GCACAAAAAGT AC C G CACAGATAAACAC C GAGGAATT ATC AT AGAGAC AGAGGGT GAC 840 

Qy 841 CAC C CT AAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAAT T CC CATTT T CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CAC CCTAAGGG CATT GAGAT GGAT GGGAAAAT GAT GAAT TCC CATTT T CT AGAT GGGAAC 900 

Qy 901 CT GGT GCCC CT GGAAGG GAAGGAAGT GGAT GAGT C CC GC AGAGAGAT GAT CC GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CTGGT GCC CCT GGAAGGGAAGGAAGTGGAT GAGT CCCGCAGAGAGAT GAT CCGGATT CTC 960 

Qy 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGT G GAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 961 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGCTAAT 1020 

Qy 1021 TACT AT GCT CTTT C C CAC CAAC AGAAGAGC CGC G C CTT CT AC C GT AT C CAAGC C ACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TACT AT GCT CTTT C CCAC CAAC AGAAGAGC CGC GC CTT CT AC C GGAT C CAAGC C ACT C GT 1080 

Qy 1081 ATGAT GACT GGTGCAGGCAATAT CCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 ATGAT GACT GGT GCAGGCAATAT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1140 

Qy 1141 T CCAGC AT GAGCGAGGT GC ACAC C GAT GAGCCT GAGGACT TT AT T T C CAAGGT CT T CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 T CCAGC AT GANNGAG GTGC ACAC C GAT GANN CT GAGGACT TT AT T T C CAAGGT CT T CT T T 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 GACCCATGTTCTTACCAATGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGGGGGAGACATGTCAAAGACCATGTAT GT GGACTACAAAACAGAGGATGGTTCT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1261 AAAGGGGGAGACATGTCAAAGACCATGTAT GT GGACTACAAAACAGAGGATGGTNNNGCC 1320 

Qy 1321 AAT G CAGGGG CT GACTAT GAGTT CACAGAGGGCAC GGT GGTT CT GAAG C CAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 AAT G CAGGGG CT GACT AT GAGTT CACAGAGGGCAC GGT GGTT CT GAAG C CAGGAGAGACC 1380 



Qy 

Db 



1381 
1381 



CAGAAGGAGTT CT C C GT GGGCATAATTGAT GAC GACAT TTTT GAGGAGGAT GAACACTTC 1440 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGAAGGAGT T CT C C GT AGGCAT AATTNNN GAC GACATTTNNN AGGAGGAT GAACACT TN 1440 



Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



1441 TTT GT AAGGT T GAGCAAT GT C CGCATAGAGGAGG AGC AGC CAGAGGAGGGGAT GC CT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 
1441 NNNNNAAGGT T GAGCAAT GT C C GC AT AGAGGAGGAGC AGC CAGAGGAGGGGAT GN CT C CA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 GCAATANNCAACAGTNNNNCCTTGCCTCGGGCTGTNNTAGCCTCCCCTTGTGTNGCCACA 1560 

1561 GT T AC CAT CT T GGAT GAT GACC AT GCAGGCATCT T C ACTT TT GAAT GTGATACT ATT C AT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GT T AC CAT CTT GGAT GAT GACCAT GCAGGC AT CT T C ACTTTT GAAT GTGATACT ATT CAT 1620 

1621 GT CAGT GAGAGT AT T GGT GT TAT GGAGGT CAAGGT T CTGC GGACAT CAGGT GCCC GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GT CAGT GAGAGT AT T GGT GT TAT GGAGGT CAAGGT T CT GC GGACAT CAGGT GC C C GGGGT 1680 

1681 ACAGT CATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGT GGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 ACAGT CAT C GT C CC CTT T AGGAC AGT AGAAGGGAC AGC CAAGGGT GGCGGT GAGGACT TT 1740 

1741 GAAGACACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GT GAAA 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1741 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GT AA 1788 
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AK044636 
LOCUS 
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VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 



Craniata; Vertebrata; Euteleostomi ; 
Sciurognathi; Muridae; Murinae; Mus . 



AK044636 2534 bp mRNA linear HTC 20-SEP-2003 

Mus musculus adult retina cDNA, RIKEN full-length enriched library, 
clone: A930029A02 product : solute carrier family 8 (sodium/ calcium 
exchanger), member 3, full insert sequence. 
AK044636 

AK044636 . 1 GI : 26336660 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci f P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno f H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



COMMENT 



FEATURES 



Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M., 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine,T., Harada,A. , 
Yamamoto, R. , Matsumoto, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi, K . , 
Fujiwake,S., Inoue,K. f Togawa,Y., Izawa,M. , Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu, M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 2534) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A. , Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A. , Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa,A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi , F . , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 
Direct Submission 

Submitted ( 16- JUL-2001 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
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cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Retina RNA was provided by Dr. Stefano Gustincich (Department of 
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02115, USA) whose assistance is gratefully acknowledged. Please 
visit our web site for further details. 
URL : http : //genome . gsc . riken . go . jp/ 
URL: http: //fantom. gsc. riken. go. jp/ . 
Location/Qualifiers 



source 1. .2534 

/organism="Mus musculus" 

/mol_type= M mRNA" 

/strain="C57BL/6J" 

/ db_x ref=" FANTOM_DB : A9 3 0 02 9 AO 2 " 

/db_xref="MGI: 2409963" 

/db_xref="taxon: 10090" 

/clone="A930029A02" 

/tissue_type=" retina" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev__stage="adult" 
CDS 713. .>2533 

/note= "unnamed protein product; putative 

solute carrier family 8 (sodium/ calcium exchanger), member 

3 (MGD|MGI: 107976, GB | NM_0 80440, evidence: BLASTN, 99%, 

match=2394) " 

/codon_start=l 

/protein_id="BAC32013. 1" 

/db_xref="GI: 26336661" 

/ trans la tion= "MCPVQGRTMS PVRGHQTARRVS FCQLWYPENPSLGDKIARVIVY 
FVALI YMFLGVS 1 I ADRFMAS I EVIT SQEREVT I KKPNGET STTT I RVWNETVSNLTL 
MALGSSAPEILLSLIEVCGHGFIAGDLGPSTIVGSAAFNMFI I IGICVYVI PDGETRK 
I KH LRVF FVT AAW S I FAY I W L YMI LAVF S P GWQVWEGL LT L F F F P VCVL LAWVADKR 
LLFYKYMHKKYRTDKHRGIIIETEGDHPKGIEMDGKMMNSHFLDGNFTPLEGKEVDES 
RREIMIRILKDLKQKHPEKDLDQLV^MANYYALSHQQKSRAFYRIQATRMMTGAGNILK 
KHAAEQAKKTSSMSEVHTDEPEDFASKVFFDPCSYQCLENCGAVLLTWRKGGDISKT 
MYVDYKTEDGSANAGADYEFTEGTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSN 
VRVEEEQLAEGMLPAI LNSLPLPRAVTjASPCVATVTILDDDHAGIFTFECDTIHVSES 
IGViyiEVKVLRTSGARGTVIVPFRTVEGTAKGGGEDFEDAYGELEFKNDETVKTIRVKI 
VDEEEYERQENFFIALGEPKWMERGISGVRFFLNQSNSQER" 

ORIGIN 

Query Match 58.7%; Score 1624.4; DB 11; Length 2534; 

Best Local Similarity 91.7%; Pred. No. 0; 

Matches 1740; Conservative 0; Mismatches 156; Indels 2; Gaps 2; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGG-CTGGTTAC 59 

I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 603 ATGGCGTGGTTACGGCTGCACCCTCTCACCTCTGCCTTCCTCCATCTTGGGCCTGGTTAC 662 

Qy 60 CTTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAG 119 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I III I I I I I I I I I I II 
Db 663 TTTTGTGCTCTTCCTGAATTGTCTTCGAGCAGAGGCTGGTGACTCGGGGGATGTGCCCAG 722 

Qy 120 CACAGGGCAGAACAATGAGT CCTGTTCAGGGTCAT CGGACT GCAAGGAGGGTGTCAT CCT 179 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 723 TGCAGGGCAGAACAATGAGTCCTGTTCGGGGTCATCAGACTGCAAGGAGGGTGTCATTTT 782 

Qy 180 GCCAA-TCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCT 238 

I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 783 GCCAACTCTGGTATCCAGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCT 8 42 

Qy 239 ATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGG 298 

I I I I I I I I II I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 843 ATTTTGTGGCCCTGATATACATGTTTCTTGGGGTGTCTATCATTGCTGACCGATTCATGG 902 



Qy 



299 



CAT CTATTGAAGTCATCACCTCT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAG 



358 



I I I I I I I I I I I I I I I I II II I I I II I I I I I I I I I I I II Mill I I I I I I I I I I 
Db 903 CAT CTATTGAAGT CATTACTTCCCAAGAGAGGGAAGTGACCAT CAAGAAGCCCAATGGAG 962 

Qy 359 AAAC CAGCACAAC CACTATT CGGGT CT GGAAT GAAACT GT CT C CAAC CT GAC CCTTAT GG 418 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I 
Db 963 AGAC C AGCACAACTACAATT C GGGT AT GGAAT GAAACT GT CT C CAAT CT GACC CT GAT GG 1022 

Qy 419 CCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGT 478 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1023 CCCTGGGCTCTTCTGCTCCAGAGATTCTCCTGTCTTTAATTGAGGTGTGTGGTCACGGGT 1082 

Qy 47 9 T CATT GCT GGT GAT CT GGGACCT T CT AC CAT T GT AGGGAGT GC AGCCT T CAAC AT GTT C A 538 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 1083 T CATT GCT GGT GAT CT GGGAC CAT CT AC CAT CGTT GGC AGT GCAGCCT T CAAC AT GTT CA 1142 

Qy 539 T CAT CATTGGCAT CTGTGTCTACGTGATCCCAGACGGAGAGACT CGCAAGATCAAGCATC 598 

I I I I I I I I I I I I I I II I II I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 
Db 114 3 T CAT CATT GGCAT CT GT GT CT AT GT GAT C C C AGAT GGGGAGACT C GAAAGAT CAAGC AC C 1202 

Qy 599 TACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGA 658 

I I I I I II I II I I I I I I I I I I I I I I I I I I Mill I I I I M I I I II I I I M I I I M 

Db 1203 TGCGAGTCTTCTTCGTCACGGCTGCTTGGAGCATCTTCGCCTACATTTGGCTCTATATGA 1262 

Qy 659 TTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCT 718 

I I II I I II I I I M I I I I I I II I II I II I M I II I I I I I I I I II I I I I II I I I I II I I 
Db 1263 TCCTGGCAGTCTTCTCTCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTTACTCTCTTCT 1322 

Qy 719 TCTTT CCAGT GTGT GT CCTT CTGGCCT GGGT GGC AGAT AAAC GACT GCT CTT CTACAAAT 77 8 

I I I I I I I I I I I I I I I I M Mill I I II I II II I I I I I I I I II II I I I II II II II I 
Db 1323 TCTTTCCCGTGTGTGTCCTGCTGGCTTGGGTGGCAGATAAGCGACTGCTCTTCTACAAAT 1382 

Qy 779 ACAT GC ACAAAAAGT ACC GCACAGACAAAC ACC GAGGAAT TAT CATAGAGAC AGAGGGT G 838 

I II I I I I I I I II I I II I II I I I I I I I I I I I I II I II I II I I II I II II II I II II II 
Db 1383 ACAT GCACAAAAAATACCGCACAGATAAACACCGAGGAATTAT CATT GAGAC AGAGGGT G 1442 

Qy 839 ACCACCCTAAGGGCATTGAGATGGAT GGGAAAAT GATGAATTCCCATTTT CTAGATGGGA 898 

I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I II II I I I I I I I I I II 
Db 1443 ACCAC CCTAAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT CT C ACTTT CT AGAT GGGA 1502 

Qy 899 AC CT GGT G CC C CT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT C C GGAT T C 958 

III II I II II II II I I I I I II I I I I I II I II I I I I II II I I I I I I I 

Db 1503 ACT T T ACACCT TT GGAAGGAAAGGAGGT AGAT GAATCT C GCAGGGAAAT GAT C C GGATT C 1562 

Qy 959 TCAAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGAT GGCCA 1018 

I I II I I I I I I I I I I II II I II I II I I II I I II II II I II I I I I I I II II II I II I I 
Db 1563 TAAAGGAT CT GAAACAAAAACACCCAGAAAAGGACCTAGATCAGCTGGTGGAGAT GGCCA 1622 

Qy 1019 AT TACT AT GCT CTTT C CCAC CAACAGAAGAGC C GC GC CTT CT AC C GT AT C CAAGC CACT C 1078 

I II I I II I I I I I II I I II I I I I II I I I I II I I I II II II II I I II I I I II I I II I 
Db 1623 ATTACT AT GCT CTTT CCCAT CAACAGAAGAGC C GT GCT TT CT AC C GCAT C CAAGC CACC C 1682 

Qy 1079 GTATGATGACTGGTGCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGG 1138 

I I II II II II I I I I I I II I I I I I II Mill II I I I I I I II II I I I II II I I I 

Db 1683 GGAT GAT GACT GGT GC GGG CAAT AT ACT T AAGAAGCAT GC AG C C GAGCAAGC CAAGAAGA 1742 

Qy 1139 CCTCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCT 1198 

II I I I I I M I I I I I I I I II M I I II I II II I II I I II II II I M I I II I I I II I 



Db 



1743 



CCTCCAGCATGAGCGAGGTGCATACCGATGAGCCGGAGGACTTTGCCTCTAAGGTCTTCT 1802 



Qy 1199 TTGACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGA 1258 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1803 T T GACCCAT GT T CTT AT CAGT GC CT G GAGAACT GT GGAGCTGT C CT C CT GAC C GT GGT GA 1862 

Qy 1259 GGAAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT G 1318 

II I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 

Db 1863 GGAAAGGGGGAGAT AT AT C CAAGAC CAT GT AC GT GGACT ACAAAACAGAGGAC GGCT CCG 1922 

Qy 1319 CCAATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGA 1378 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1923 CCAAT GCAGGGGC AGACTAT GAGT T C ACAGAGGGC ACT GT GGTT CT GAAGC CAGGAGAGA 1982 

Qy 1379 CCCAGAAGGAGTTCT CCGT GGGCATAATTGATGAC GACATTTTTGAGGAGGATGAACACT 1438 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1983 CC CAGAAGGAGT T CT CT GT GGGC AT CAT T GAT GAT GACAT TT TT GAGGAGGAT GAAC ACT 2042 

Qy 1439 T CT T T GT AAG GT T GAGC AAT GT C C GCAT AGAGGAGGAGC AGC C AGAG GAGGGGAT GC CT C 1498 

I I I I I I I III I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2043 T CT T T GT GAGGCT GAGC AAT GT C C GT GT AGAAGAGGAGCAGCT GGC G GAGGGGAT GCT C C 2102 

Qy 1499 CAGCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCA 1558 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2103 CAGCAATACTCAATAGTCTTCCTTTGCCTCGGGCTGTCCTGGCCTCCCCTTGTGTGGCCA 2162 

Qy 1559 CAGTT ACCAT CTT GGAT GAT GAC CAT GCAGGCATCTT CACTTTT GAAT GT GAT ACT ATTC 1618 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 
Db 2163 CAGTAACCATCTT GGAT GATGAC CAT GCAGGAATTTTCACTTTT GAAT GT GAT AC CATTC 2222 

Qy 1619 ATGTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGG 1678 

I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I III 
Db 2223 ATGT CAGTGAAAGTATTGGTGTTAT GGAAGTCAAGGTTTTGAGGACAT CAGGT GCCAGGG 2282 

Qy 1679 GTACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACT 1738 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 2283 GCACAGTCATCGTCCCTTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGTGGCGAGGACT 2342 

Qy 1739 TTGAAGACACAT ATGGGGAGTTGGAATT CAAGAAT GATGAAACT GT GAAAACCATAAGGG 1798 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2343 T T GAAGAT GCAT AT GGGGAGCT GGAGT T CAAGAAT GAT GAAACAGT GAAAAC C AT AAGGG 2402 

Qy 1799 T TAAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAATTT CT T CAT TGCCCTTGGTG 1858 

I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2403 T TAAAAT AGT AGAT GAGGAGGAGT AC GAGAGGCAAGAGAATT T CTT CAT TGCCCTTGGTG 2462 

Qy 1859 AACCGAAATGGAT GGAACGT GGAAT AT CAGAT GTGACA 1896 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2463 AAC C GAAAT GGAT GGAACGT GGAAT AT CAGGT GT GAGA 2500 



RESULT 5 
AY401285 

LOCUS AY401285 1788 bp DNA linear GSS 15-DEC-2003 

DEFINITION Mus musculus SLC8A3 gene, VIRTUAL TRANSCRIPT, partial sequence, 

genomic survey sequence. 
ACCESSION AY401285 



VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



AY401285.1 GI:39757274 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus, 

1 (bases 1 to 1788) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal,A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J . J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 1788) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Car gill, M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .1788 

/organism="Mus musculus" 
/mol_type= "genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>1788 
/gene="SLC8A3" 
/locus_tag="HCM08 3 9 " 



ORIGIN 



Query Match 55.9%; 
Best Local Similarity 91.6%; 
Matches 1637; Conservative 



Score 1546.4; 
Pred. No. 0; 
0; Mismatches 



DB 29; Length 1788; 
151; Indels 0; Gaps 



Qy 

Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1 ATGGCGTGGTTACGGCTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACT 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I II 
61 TTTGTGCTCTTCCTGAATTGTCTTCGAGCAGAGGCTGGTGACTCGGGGGATGTGCCCAGT 120 

121 ACAGG GCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGG GT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
121 GCAGGGCAGAACAAT GAGT CCTGTTCGGGGT CAT C AGACT GCAAG GAGG GT GT CATTTT G 180 

181 C CAAT CTGGT AC CC GGAGAAC CCTTCCCTT G GGGACAAGATT GC CAGGGT CAT T GT CT AT 240 

I I I I I I I I I I I II I II I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
181 CCAATCTGGTATCCAGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 



Qy 



241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 



Db 



241 TTTGTGGCCCTGATATACATGTTTCTTGGGGTGTCTATCATTGCTGACCGATTCATGGCA 300 



Qy 301 T CT ATT GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 

Db 301 TCTATTGAAGT CATTACTTCCCAAGAGAGGGAAGT GACCATCAAGAAGCCCAAT GGAGAG 360 

Qy 361 AC C AGCACAAC CACT AT T C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CTT AT GGC C 420 

I I I I I I I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AC C AGCACAAC TACAATT C GGGT AT GGAAT GAAACT GT CT CCAAT CT GAC C CT GAT G GC C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I ! I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGCTCTTCTGCTCCAGAGATTCTCCTGTCTTTAATTGAGGTGTGTGGTCACGGGTTC 480 

Qy 481 AT T GCT GGTGAT CT GGGAC CT T CT AC CAT T GT AGGGAGT G CAGC CT T CAAC AT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II I II II I I 

Db 481 AT T GCT GGTGAT CT GGGAC CAT CT ACCAT CGT T G GC AGT GCAGC CT T CAAC AT GT T CAT C 540 

Qy 541 AT CAT T GGC AT CT GT GT CT AC GT GAT C C CAGAC GGAGAGACT C GCAAGAT CAAG CAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II 

Db 541 AT CATTGGCAT CTGTGTCT AT GTGAT CCCAGAT GGGGAGACTCGAAAGAT CAAGCACCT G 600 

Qy 601 C GAGT CTT CT T CAT CACC GCT GCT T GGAGT AT CT T T GCCT ACAT CT GGCT CT AT AT GAT T 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I I I I II 

Db 601 CGAGTCTTCTTCGTCACGGCTGCTTGGAGCATCTTCGCCTACATTTGGCTCTATATGATC 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I 

Db 661 CTGGCAGTCTTCTCTCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTTACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I II I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 721 TTTCCCGTGTGTGTCCTGCTGGCTTGGGTGGCAGATAAGCGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGT AC C GCAC AGACAAAC AC C GAGGAATT AT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 781 AT GCACAAAAAAT AC C GCAC AGATAAAC AC C GAGGAATTAT CATT GAGACAGAGGGT GAC 840 

Qy 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 841 CAC C CT AAGGG C ATT GAGAT GGAT GGGAAAAT GAT GAATTCTCACT TT CT AGAT GGGAAC 900 

Qy 901 CT GGT GCCCCT GGAAGGGAAGGAAGTGGAT GAGT CC CGCAGAGAGAT GAT CC GGATT CT C 960 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TTTACACCTTT GGAAGGAAAGGAGGTAGATGAATCT CGCAGGGAAAT GAT CCGGATT CT A 960 

Qy 961 AAGGAT CT GAAGCAAAAAC AC C CAGAGAAG GACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGGAT CT GAAACAAAAACAC C CAGAAAAG GAC CT AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 108O 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I M II II I I I I I I I II I I I I I I I I II 

Db 1021 TACT AT GCT CT TT C CCAT CAACAGAAGAGC C GT GCTT T CT ACCG CAT C CAAG C CAC C C GG 1080 

Qy 1081 AT GAT GACT GGTGCAGGCAAT ATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I II I I I I I I I I I II I I I I II II Mill II M I I I I II I I II I I I M II I M 

Db 1081 AT GAT GACT GGT GCGGGCAATAT ACTTAAGAAGCAT GCAGCCGAGCAAGCCAAGAAGACC 1140 



Qy 

Db 



1141 
1141 



T C CAGCAT GAGC GAGGT GC ACACCGAT GAGC CT GAGGACTTT ATT T C CAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
T C CAGCAT GAGC GAGGT GCATACC GAT GAGC CG GAGGACTTT GCCTCTAAGGT CTT CTTT 1200 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

1201 GAC C CAT GT T CTT AT CAGT GCCT GGAGAACT GT GGAGCT GT CCT C CT GAC C GT GGT GAGG 1260 

1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT AC AAAAC AGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III 

12 61 AAAGGGGGAGAT AT AT C CAAGAC CAT GTAC GT GGACT ACAAAACAGAGGAC GGCTCCGCC 1320 

1321 AAT GCAGGG GCT GACT ATGAGTT CACAGAGGGCACGGT GGTTCT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I II I II 

1321 AAT GCAGGGGCAGACT AT GAGTT CACAGAGGGCACT GT GGTT CT GAAGC CAGGAGAGACC 1380 

1381 CAGAAGGAGT T CT C C GT GGGC ATAATT GAT GAC GACATT TTTGAG GAGGAT GAAC ACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

1381 CAGAAGGAGTTCT CTGTGGGCAT CATTGATGAT GACATTTTTGAGGAGGAT GAACACTTC 1440 

1441 TTT GTAAGGTT GAGCAAT GT CC GC ATAGAGGAGGAGCAGCC AGAGGAGGGGAT GC CT C C A 1500 

I I I II III I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I II I II III 

1441 TTTGTGAGGCTGAGCAATGTCCGTGTAGAAGAGGAGCAGCTGGCGGAGGGGATGCTCCCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
1501 GCAATACTCAATAGTCTTCCTTTGCCTCGGGCTGTCCTGGCCTCCCCTTGTGTGGCCACA 1560 

1561 GT TACCAT CTT GGAT GAT GAC CAT G CAGGCAT CTT CACT TTT GAAT GT GAT ACT AT T CAT 1620 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
GT AAC CAT CT T GGAT GAT GACC AT GCAGGAATT TT CACT TTT GAAT GT GAT AC CAT T CAT 1620 



1561 



1621 



1621 



GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I 11111111111111111 I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

GT CAGTGAAAGT ATT GGT GT T AT GGAAGT CAAGGTTT TGAGGACAT C AGGT GC CAGGGGC 1680 



1681 AC AGT CAT C GT C C C CT T T AGGACAGT AGAAGGGACAGCCAAGGGT GGC GGT GAGGACT TT 1740 

I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 

1681 AC AGT CAT CGTCCCTTT T AGGACAGT AGAAGGGACAGCCAAGGGT GGT GGC GAGGACTT T 174 0 

1741 GAAGACACATAT GGGGAGT T GGAATT CAAGAAT GAT GAAACTGT GAAA 1788 

I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I III II 
1741 GAAGATGCATAT GGGGAGCT GGAGTTCAAGAAT GATGAAACAGTGTAA 1788 



RESULT 6 
AK035163 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 



AK035163 4374 bp mRNA linear HTC 18-SEP-2003 

Mus musculus 12 days embryo embryonic body between diaphragm region 
and neck cDNA, RIKEN full-length enriched library, clone : 9430095C22 
product: SODIUM/ CALCIUM EXCHANGER 2 PRECURSOR (NA(+) /CA( 2+) -EXCHANGE 
PROTEIN 2) homolog [Rattus norvegicus] , full insert sequence. 
AK035163 

AK035163.1 GI:26084435 

HTC; CAP trapper. 

Mus musculus (house mouse) 



ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



Mus mus cuius 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y . 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata, Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno, H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata, K. 



Itoh,M. 



Konno, H. 
Sumi,N. , 



TITLE 
JOURNAL 



Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P., 
Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M., 
Eshii,Y., Nakamura,S., Hazama,M., Nishine,T., Harada,A. , 
Yamamoto,R., Matsumoto, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake, S . , Inoue,K., Togawa,Y., Izawa,M. f Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y . 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multicapillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 4374) 

Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno, H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata, K., Shinagawa,A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A. , Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A. , Toya,T., Yasunishi,A. , 
Muramatsu,M. and Hayashizaki, Y. 
Direct Submission 

Submitted ( 16- JUL-2001 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN), Laboratory for Genome 



Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-004 5, Japan ( E-mail : genome-res@gsc . riken . go . jp, 
URL :http: //genome. gsc. riken. go. jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL : http : //genome . gsc . riken . go . jp/ 
URL:http: //fantom. gsc. riken. go. jp/ . 
FEATURES Location/Qualifiers 
source 1. .4374 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db_x r e f = " FANTOMJDB : 9 4 3 0 0 9 5 C2 2 " 

/db_xref ="MGI : 2399390" 

/db_xref="taxon: 10090" 

/clone="9430095C22" 

/tissue_type="embryonic body between diaphragm region and 
neck" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="12 days embryo" 
misc_feature 281. .3046 

/note="SODIUM/CALCIUM EXCHANGER 2 PRECURSOR 
(NA(+)/CA(2+) -EXCHANGE PROTEIN 2) homolog [Rattus 
norvegicus] (SWISSPROT | P48768 , evidence: FASTY, 97%ID, 
100%length, match=2763) 
putative" 

ORIGIN 



Query Match 45.5%; Score 1258.2; DB 11; Length 4374; 

Best Local Similarity 68.7%; Pred. No. 5.1e-298; 

Matches 1829; Conservative 0; Mismatches 783; Indels 51; Gaps 5; 

Qy 136 GAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCG 195 

II III I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 4 01 GAAGGCTGCCAAGGTTCCTACCGCTGCCAACCAGGTGTGCTGCTGCCTGTGTGGGAACCC 4 60 



Qy 196 GAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATA 255 

I I I I I I I II II II I I I I I I I I I I III I I II II I I I I I I I I I II I 

Db 461 GAGGACCCATCGCTGGGCGACAAGGTTGCACGGGCCGTGGTGTACTTTGTGGCCATGGTC 520 



Qy 256 T ACAT GTT CCTTGGGGT GT CCAT CAT T GCT GAC CGCTT CAT GG CAT CTATT GAAGT CAT C 315 

I I I I I I I I I I I II I I I I I I I I I I I I I II I I II I I I II I I I II I I I I I I I I I 
Db 521 T ACAT GTT C CT GGGT GT GT CT AT CATTGC C GAT CGATT T AT GG C AT CCAT T GAGGT CAT C 580 



Qy 316 ACCT CT CAAGAGAGGGAGGTGACAATTAAGAAACCCAAT GGAGAAACCAGCACAACCACT 375 

I I I I I I I I I I II I I I I I I II I I I I II I I I I I I I I III 
Db 581 ACAT CCAAGGAGAAAGAGATCACCATCACCAAGGCAAAT GGGGAGACCAGCGTGGGCACG 640 



Qy 

Db 



376 ATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCT 435 

I II I I I I I I I II II II I I II I I I I II II I I I I I I I I I I I I I I I I II 
641 GTGCGCATCTGGAACGAGACGGTGTCCAACCTTACACTCATGGCCCTGGGCTCCTCAGCG 700 



436 CCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTG 495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 

701 CCTGAGATTCTGTTGACTGTCATCGAGGTCTGTGGCCACAACTTCCAGGCCGGTGAGCTA 760 

496 GGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATCATCATTGGCATCTGT 555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

761 GGCCCAGGCACCATCGTGGGCAGTGCCGCCTTCAACATGTTTGTGGTCATTGCTGTTTGT 820 

556 GT CT AC GT GAT C C C AGAC GGAGAGACTC GCAAGAT CAAGC AT CTACGAGT CT T CT T CAT C 615 

I I I I I I I I I I I I II Mil I I I I I I I I I I I II I I I I I I I I I I I II 

821 GTGT AT GT CAT CC C GGCT GG C GAGAGC C GTAAGAT CAAGC ACCT GAGGGT CTTCTTTGTC 880 

616 ACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCC 675 

II II I I I I II I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 

881 ACAGCCTCCTGGAGCATCTTTGCCTATGTCTGGCTTTATCTCATTCTAGCAGTTTTCTCC 940 

676 CCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTC 735 

II I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I I I I 
941 CCAGGTGTAGTCCAGGTGTGGGAGGCACTGCTCACACTGATCTTCTTCCCGGTGTGTGTG 1000 

736 CTT CT GGC CT GGGT GGCAGATAAAC GACT GCT CTT CT ACAAAT AC AT GCACAAAAAGT AC 795 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III 
1001 GTGTTTGCCTGGATGGCGGACAAGCGACTGCTCTTCTACAAGTACGTGTACAAGCGCTAC 1060 

796 C GCAC AGACAAAC AC C GAGGAAT TAT C ATAGAGAC AGAGG GT GAC CAC C CT AAGGGC ATT 855 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1061 CGCAC C GAC C CTC GCAGT GGAAT CAT CAT C GGGGC AGAGGGAGACCC AC C CAAGAGC AT C 1120 

856 GAGAT GGAT GGGAAAATGATGAATTCCCATTTT CTAGAT GGGAA CCTG 903 

I I I I I I I I I I I I I I I I I I I I I I 

1121 GAGCTGGACGGCACATTCGTGGGCACTGAGGTCCCTGGCGAGCTGGGCGCATTGGGCACA 1180 

904 GT GC C C CT GGAAGG GAAGGAAGT GGAT GAGT CC C GCAGAGAGAT GAT C C GGAT T CT CAAG 963 

I II I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 
1181 G GT C CT GCT GAGGC GC GT GAACT AGAT GC CAGC CG GC GT GAGGT CAT C CAGAT C CTTAAG 1240 

964 GAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGAT GGCCAATTAC 1023 

II I I II I I I I I I I I II I I I I I I I I I I I I I I II I II I I I II I I I I I I 
1241 GACTT GAAGCAGAAGCACCCGGATAAGGACCTGGAGCAGCTGAT GGGCATCGCCAAGT AC 1300 

1024 TATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATG 1083 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

1301 T AT GC ACT GCT GCAC CAGC AGAAGAGCCGCGCCTTCTACCGC AT CCAGGC CAC GC GGCT G 1360 

1084 AT GACT GGTGCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT CC 1143 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III II I 

1361 ATGACAGGTGCGGGCAATGTGCTGCGCAGACATGCTGCGGATGCTGCCCGCAGG CCG 1417 

1144 AGCAT GAGC GAGGT GCACAC CGAT GAGCCT GAGGACTT T ATTT C CAAGGT CT T CTTT GAC 1203 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

1418 G GAGC CACC GAT GGT G CC C CC GAT GAT GAGGACGATGGT GCCAGT CG C AT CT T CT TT GAG 1477 

1204 CCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGGAAA 1263 

II I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I 

1478 CCCAGCCTCTATCACTGCCTGGAAAACTGCGGGTCAGTGCTGCTGTCCGTGGCTTGCCAG 1537 



Qy 1264 GGGGGAGAC AT GT CAAAGACCAT GTAT GT GGACT ACAAAAC AGAGGAT GGT T CT GCCAAT 1323 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1538 GGCGGTGAGGGCAACAGCACCTTCTACGT GGACT ACCGTACCGAGGACGGTTCTGCAAAG 1597 

Qy 1324 GCAGGGGCT GACT AT GAGTT CACAGAGGG CAC GGT GGTT CT GAAGC CAGGAGAGAC CCAG 1383 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1598 GCAGGCTCCGATTATGAGTACAGCGAGGGCACGCTGGTGTTCAAGCCCGGGGAGACGCAG 1657 

Qy 1384 AAGGAGT T CT CC GT GGGCATAAT T GAT GAC GAC AT TT TT GAGGAGGAT GAACACTT CT TT 1443 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1658 AAGGACCT G C GCAT C GGGAT CAT CGAC GAC GAC AT CT T C GAGGAGGAT GAGCACTT CT T C 1717 

Qy 14 44 GTAAGGTTGAGCAATGT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCAGCA 1503 

II III II II III II III III I I I 

Db 1718 GTGAGGCTGCTGAACCTGCGTGTGGGCGATGCTCAGGGCATGTTCGAG 1765 

Qy 1504 ATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTT 1563 

I I I I I III II III III I I I I I I I I I 

Db 1766 CCCGACGGCGGTGGGCGGCCCAAGGGGCGGCTGGTGGCGCCGCTGCTGGCCACTGTC 1822 

Qy 1564 AC CAT CT T GGAT GAT GAC CAT GC AGGC AT CT T CACT T T T GAAT GT GAT ACT ATT CAT GT C 1623 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1823 ACCATCCTGGACGACGACCACGCGGGCATCTTCTCCTTCCAGGACCGCCTGCTGCATGTG 1882 

Qy 1624 AGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACA 1683 

II I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I 

Db 1883 AGCGAGTGCATGGGCACTGTGGATGTGCGCGTGGTTCGCAGCTCGGGCGCCCGTGGCACT 1942 

Qy 1684 GTCAT CGT CCCCTTT AGGACAGTAGAAGGGACAGCCAAGGGT GGCGGT GAGGACTTT GAA 1743 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 194 3 GTACGCCTCCCCTACCGCACAGTGGACGGCACGGCCCGTGGCGGTGGTGTACATTACGAG 2002 

Qy 1744 GACACATAT GGGGAGTT GGAATTCAAGAATGAT GAAACTGT GAAAACCATAAGGGTTAAA 1803 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2003 GAT GCTT GT GGAGAGCT GGAGTT C GGC GAT GAT GAGAC CAT GAAAACT CT T C AGGT CAAG 2062 

Qy 1804 AT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT T T CT T CAT TGCCCTTGGT GAAC C G 1863 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2063 AT AGT GGAT GAT GAAGAGT AT GAGAAGAAGGACAACT T CT T CAT T GAGCT GGGC C AGC C C 2122 

Qy 1864 AAAT GGAT GGAAC GT GGAAT AT C AGAT GT GAC AGACAGGAAG 1905 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2123 C AGT G GCTT AAGC GAGGC AT CT C AGCT CT GCT ACT CAAC CAAGGGAAT GGAGACAAGAAG 2182 

Qy 1906 CT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC C AGT AT T GGGT 1965 

I III II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I II 
Db 2183 ATAACT GCAGAG C AGGAGGAGGCC C AGAGGAT AGCAGAGAT GGGCAAGC C AGTT CTT GGG 2242 

Qy 1966 GAAC AC C C CAAACT AGAAGT CAT CATT GAAGAGT CCT AT GAGT T CAAGACT ACGGT GGAC 2025 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2243 GAGAACAAT C GC CT C GAGGT CAT CATCT AGGAGT CT T AT GACT TTAAGAAC ACGGT GGAT 2302 

Qy 2026 AAACT GAT CAAGAAGACAAACCT GGC CTT GGT T GT GGGGAC C CATT CCT GGAGGGAC C AG 2085 

II I I I II I I I II II I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I III 
Db 2303 AAACT CAT AAAGAAAAC GAAC CT GGCCTT GGT GATT GGGACTCACT CAT GGAGGGAGCAG 2362 



Qy 



2086 T T CAT GGAGGC CAT CAC CGT CAGT GC AGCA GGG GAT GAGGAT GAGGAT GAAT C C GGG 2142 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2363 TT T AT AGAGGC AGT TAC C GTAAGC GCAGGGGACGAGGAGGAGGAT GAGGAT GGACCT CGT 2422 



Qy 2143 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 2202 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2423 GAGGAGCGGCTGCCGTCCTGCTTTGACTACGTGATGCACTTCCTGACGGTATTCTGGAAA 2482 

Qy 2203 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 2262 

II II II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2483 GTTCTATTCGCCTGCGTTCCACCCACGGAGTACTGCAATGGCTGGGCCTGCTTTGGTGTC 2542 

Qy 2263 TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 2322 

I I I I I I I I I I I I I I I I I I I I I III I I I I II I I I I I I I I I I I I I I I I II 
Db 2543 TGCATCCTGGTCATTGGTGTGCTCACTGCCCTCATCGGAGACCTGGCCTCACACTTTGGG 2602 

Qy 2323 TGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCT 2382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 111111111 

Db 2603 TGCACCGTGGGCCTCAAGGACTCAGTCAACGCCGTGGTCTTCGTAGCCCTGGGCACCTCC 2662 

Qy 2383 GT CC C AGAT AC GTT TGCC AGCAAAGCTGCT GC CCT C CAGGAT GT AT AT G C AGAC GC CT C C 2442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2663 ATCCCTGACACGTTCGCCAGCAAGGTGGCCGCGCTGCAGGACCAGTGTGCCGACGCGTCC 2722 

Qy 2443 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 2502 

II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I 

Db 2723 ATCGGTAACGTGACCGGCTCCAATGCGGTGAACGTGTTCCTGGGCCTGGGTGTGGCCTGG 2782 

Qy 2503 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 2562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2783 TCGGTGGCAGCGGTATACTGGGCGGTGCAGGGTCGCCCCTTCGAGGTGCGTGCAGGCACG 2842 

Qy 2563 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 2622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2843 CTGGCCTTCTCGGTCACGCTGTTCACCGTCTTCGCCTTCGTGTGCATCGCAGTGCTGTTG 2902 

Qy 2623 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 2682 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2903 TACCGGCGCCGGCCGCAGATTGGCGGCGAGCTGGGCGGCCCGCGGGGACCCAAGCTGGCC 2962 

Qy 2683 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 2742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I II I 

Db 2963 ACCACCGCTCTCTTCCTGGGCCTCTGGTTCCTCTACATTCTCTTCTCCAGCCTGGAGGCT 3022 

Qy 2743 TATTGCTACATCAAGGGGTTCTA 2765 

II I I I I I I I I I I I II I I I 

Db 3023 TACTGCCACATCCGGGGCTTCTA 3045 
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AY398961 2922 bp DNA linear GSS 15-DEC-2003 

Homo sapiens SLC8A1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY398961 

AY398961.1 GI:39754950 
GSS. 

Homo sapiens (human) 
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Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 2922) 

Clark, A. G . , Glanowski , S . , Nielson,R., Thomas, P. , Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B. , 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2922) 

Clark,A.G., Glanowski, S . , Nielson,R. , Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu, F. , Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualif iers 

1. .2922 

/organism="Homo sapiens" 

/mol_type=" genomic DNA" 

/db_xref="taxon: 9606" 

<1. ->2922 

/gene="SLC8Al" 

/ locus_tag="HCM00 65 " 



ORIGIN 



Query Match 43.7%; Score 1208.8; DB 29; 

Best Local Similarity 66.9%; Pred. No. 6e-286; 
Matches 1887; Conservative 0; Mismatches 762; Indels 



Length 2 922; 

171; Gaps 



Qy 

Db 



109 GAC GT GC CAAGC AC AGGG CAGAACAAT GAGTC CT GTT C AGG GT CAT C GGACT GCAAGGAG 168 

II II II III I I I I I I II I I I I I I I I II I I I I I 

112 GAAAT GGAAGGAGAAGGAAAT GAAACT GGT GAAT GTACT GGAT CAT AT TACT GTAAGAAA 171 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



169 GGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGG 228 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
172 GGGGTGATTTTGCCCATTTGGGAACCCCAAGACCCTTCTTTTGGGGACAAAATTGCTAGA 231 



229 



288 



GTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGAC 

I I III I I I I I I I I I I I I II I I I I I I II I I II I I II II I I I I I I I I I I 

232 GCTACTGTGTATTTTGTGGCCATGGTCTACATGTTTCTTGGAGTCTCTATCATAGCTGAT 291 

289 C GCTT CAT GGCAT CT AT T GAAGT CAT C ACCT CT CAAGAGAGG GAGGT GACAATTAAGAAA 34 8 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I II II I I I I I I 

292 CGGTT CAT GT C CT CT AT AGAAGT CAT CACAT CT CAAGAAAAAGAAATAAC CAT AAAGAAA 351 

349 C CCAAT GGAGAAAC C AGCACAAC CACT AT T C G GGTCT GGAAT GAAACT GT CT CCAACCT G 408 

I I I I I I I I I I I I I I I II II III I II I I I II I I I I I I I I II II I I I I I I 
352 C C CAAT GGAGAG AC C ACCAAGACAACT GT G AGGAT CT GGAAT GAAAC AGTTT CT AAC CT G 411 



Qy 



4 09 ACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGT 468 



Ill I 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 412 ACCTTGATGGCCCTGGGATCTTCTGCTCCTGAGATTCTCCTTTCAGTAATTGAAGTGTGT 471 

Qy 4 69 GGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC 528 

II III I I I I III II II II II III I I I I I II II I I I I I II III 
Db 472 GGC CATAACTT CACT GCAG GAGAC CT C GGT CCT AGC ACCAT C GTGGGAAGT GCT GC AT T C 531 

Qy 529 AAC AT GT T CAT CAT C ATT GGCAT CT GT GT CTAC GTGAT C C CAGACGGAGAGACT CGCAAG 588 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 532 AAT AT GTT CAT CAT T ATT GCACT CT GT GT T TAT GTGGT GCCT GAC GGAGAGACAAGGAAG 591 

Qy 589 ATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGG 648 

II I I I I I I I II I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I 

Db 592 ATTAAGCATTTGCGTGTCTTCTTTGTGACAGCAGCCTGGAGCATCTTTGCCTACACCTGG 651 

Qy 649 CTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTC 708 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III 
Db 652 CTTTACATTATTTTGTCTGTCATATCTCCTGGTGTTGTGGAGGTCTGGGAAGGTTTGCTT 711 

Qy 709 ACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTC 768 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 712 ACTTTCTTCTTCTTTCCCATCTGTGTTGTGTTCGCTTGGGTAGCGGATAGGAGACTTCTG 771 

Qy 769 TT CTACAAAT ACAT GCACAAAAAGT AC C GCAC AGACAAACAC C GAGGAATT AT C AT AGAG 828 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 772 TTTTACAAGTATGT CTACAAGAGGTAT CGAGCT GGCAAGCAGAGGGGGATGATTATTGAA 831 

Qy 829 ACAGAGGGT GACCAC C C TAAGGGCATTGAGATGGAT GGGAAAATGAT GAAT 879 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 832 CAT GAAGGAGACAGGCCAT CTTCTAAGACT GAAATTGAAATGGACGGGAAAGTGGT CAAT 891 

Qy 880 T C C CAT T T T CT AGAT GGGAAC CT GGT GC C C CT GGAAGGGAAG 921 

I I I I I I I I I I I I I I II III 

Db 892 T CT CAT GT TGAAAATT T CT T AGAT GGT GCT CT GGTT CT GGAGGT GGAT GAGAGG GAC CAA 951 

Qy 922 GAAGT GGATGAGTCCCGCAGAGAGATGATCCGGATTCT CAAGGAT CTGAAGCAAAAACAC 981 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 952 GAT GAT GAAGAAGCT AGGC GAGAAATGGCT AGGAT T CT GAAGGAACTTAAGC AGAAGC AT 1011 

Qy 982 C C AGAGAAG GACTT AGAT CAGCT GGTGGAGAT GGCCAAT T ACT AT GCT CTT T CC CACCAA 1041 

I I I I I I I I I I I I I I I I III I I I I I I I I I I II I I I I 

Db 1012 C C AGATAAAGAAAT AGAGCAATT AAT AGAATT AGCTAACT AC CAAGT C CTAAGT CAGCAG 1071 

Qy 1042 CAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAAT 1101 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1072 CAAAAAAGT AGAGC AT TT T AT CGCATT CAAGCT ACT C GCCT CAT GACT GGAGCT GGCAAC 1131 

Qy 1102 AT C CT GAAGAAACAT GCAGC AGAACAAG C C AAGAAGG C CT C CAGC AT GAGC GAGGT GCAC 1161 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 
Db 1132 ATTTTAAAGAGGCATGCAGCT GACCAAGCAAGGAAGGCTGTCAGCAT GCAC GAGGT CAAC 1191 

Qy 1162 AC C GAT GAGCCT G AGGACTT T ATT T C CAAGGT CT T CTTT GAC C CAT GT T CT T ACCAG 1218 

I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
Db 1192 ACT GAAGT GACT GAAAAT GAC CCT GTT AGT AAGAT CTT CT TT GAACAAGGGACAT AT C AG 1251 

Qy 1219 TGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGGAAAGGGGGAGACATGTCA 1278 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 



Db 1252 TGTCTGGAGAACTGTGGTACTGTGGCCCTTACCATTATCCGCAGAGGTGGTGATTTGACT 1311 

Qy 1279 AAGACCATGT ATGT GGACTACAAAACAGAGGATGGTTCT GCCAATGCAGGGGCTGACTAT 1338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1312 AACACTGT GTTT GTT GACTTCAGAACAGAGGATGGCACAGCAAAT GCT GGGT CT GAT TAT 1371 

Qy 1339 GAGTT C AC AGAGGG C ACGGT GGTT CT GAAGC CAGGAGAGAC C CAGAAGGAGT T CT C C GT G 1398 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II III 

Db 1372 GAATT T ACT GAAGGAACT GT GGT GT TTAAGC CT GGT GAT AC C CAGAAGGAAAT CAGAGTG 1431 

Qy 1399 GGCATAATTGATGACGACATTTTT GAGGAGGAT GAACACTT CTTTGTAAGGTTGAGCAAT 1458 

II II II II II I II II II II I I I I I I I I I I I I III I I I I I I I I I I I 

Db 1432 GGT AT C AT AGAT GAT GAT AT CT T T GAGGAGGAT GAAAATTT C CTT GT GCAT CT CAGCAAT 14 91 

Qy 1459 GT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTC CAGCAAT ATT CAACAGT CTT 1518 

III II II MM II II II I II I I I I I I 

Db 14 92 GT CAAAGT ATCTT CT GAAGCTT CAGAAGAT GGCAT ACTGGAAGC CAATCAT 1542 

Qy 1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 1578 

I II III I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1543 GTTTCTACACTTGCTTGCCTCGGATCTCCCTCCACTGCCACTGTAACTATTTTTGATGAT 1602 

Qy 1579 GACCAT GCAGGCATCTTCACTTTT GAAT GTGAT ACT ATTCAT GT CAGT GAGAGTATTGGT 1638 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1603 GAC C ACGC AGGC ATTT T T ACTTTT GAGGAAC CT GT GACT CAT GT GAGT GAGAGCAT T GGC 1662 

Qy 1639 GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTT 1698 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1663 AT CAT GGAGGT GAAAGT AT T GAGAACAT CT GGAGCT C GAGGAAAT GT TAT C GTT C CAT AT 1722 

Qy 1699 AGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTTGAAGACACATATGGGGAG 1758 

I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1723 AAAAC CAT C GAAGGGACT GC C AGAGGTGGAGGGGAG GAT TTT GAG GAC ACT T GT GGAGAG 1782 

Qy 1759 TT G GAATT CAAGAAT GAT GAAACT GT GAAAAC CATAAG GGT TAAAAT AGT AGAT GAGGAG 1818 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1783 CT C GAATT C CAGAAT GAT GAAATT GT CAAAACAAT AT CAGT CAAGGTAAT T GAT GAT GAG 1842 

Qy 1819 GAAT ACGAAAGGCAAGAGAATTT CT T CATT GCCCTTGGT GAAC C GAAAT GGAT GGAA 1875 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1843 GAGTATGAGAAAAACAAGACCTTCTT CCTT GAGATT GGAGAGCCCCGCCT GGT GGAGATG 1902 

Qy 1876 1875 

Db 1903 AGTGAGAAGAAAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1962 

Qy 1876 1875 

Db 1963 NNNNNNNGCCAACCTGTCTTCAGGAAGGTTCATGCTAGAGAACATCCGATTCTCTCTACT 2022 

Qy 1876 CGT GGAAT ATCAGAT GT GACAGACAGGAAGCT GACTATGGAAGAAGAGGAG 1926 

III I II I I I I I I I I I I I I I I I I I I 

Db 2023 GTAATCAC C ATT GC AGAC GAAT ATGATGACAAGCAGCC ACT GAC CAGCAAAGAGGAAGAG 2082 

Qy 1927 GC CAAGAG GATAGC AGAGAT GGGAAAGC CAGT AT T GGGT GAACAC C C CAAACT AGAAGT C 198 6 

I I I I I I I I 1 I I I I I I I II I I I I I I I I II I II I I I I II I 

Db 2083 GAGAGGC G CATT GC AGAAAT GGGGC GCC CC ATC CT GGGAGAGCAC AC CAAGTT GGAAGTG 2142 



Qy 

Db 



1987 AT CATT GAAGAGT CCTAT GAGTT CAAGACT AC GGTGGACAAACTGAT CAAGAAGACAAAC 204 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I I I I I I I I I 
2143 AT CATT GAAGAATCCTATGAATTCAAGAGT ACT GTGGACAAACTCATTAAGAAGACAAAC 2202 



Qy 2047 CTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATCACCGTC 2106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2203 CT GGCCCTTGTGGTT GGGACTAACAGCT GGAGAGAACAGTT CATT GAAGCTATCACTGT C 2262 

Qy 2107 AGT GCAGCAGGGGAT GAGGATGAGGAT GAATCCGGGGAGGAGAGGCT GCCCTCCT GCTTT 2166 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2263 AGT GCT GGGGAAGAT GAT GAC GAC GAT GAATGT GGGGAAGAGAAG CT GCC CT CCT GTT T C 2322 

Qy 2167 GACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCC 2226 

II I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I II I I I II I I I I I 

Db 2323 GATTACGTGATGCACTTTCTGACTGTGTTCTGGAAGGTCCTGTTTGCCTTCGTCCCCCCT 2382 

Qy 2227 ACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTC 2286 

II II I I I I I I I I I I II I I II III I I I I I I I I I I I I I I I I I I I I I II 
Db 2383 ACTGAATACTGGAATGGCTGGGCGTGTTTCATTGTCTCCATCCTCATGATTGGCCTACTG 2442 

Qy 2287 ACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCA 2346 

II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2443 ACAGCTTTCATTGGAGACCTGGCTTCCCACTTTGGCTGCACCATTGGCCTGAAAGATTCT 2502 

Qy 2347 GTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAA 2406 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2503 GT GACT GCAGT C GT GTT C GT CGC ACT T GGAAC AT C AGT GC CAGAC AC ATT T GCCAGCAAA 2562 

Qy 2407 GCT GCT GCCCTCCAGGATGTATATG CAGAC GCCTC CAT TGGCAACGT GAC GGGCAGCAAC 2466 

I II III I I I I I I I I I I I I I II I II I I I I I II I I I I I I I I I I I I I I I I I 

Db 2563 GT GGC AGC CAC CCAGGAC CAGT AT GC AGAC GC CT CC AT AGGTAAC GT CAC GGGCAGCAAC 2622 

Qy 24 67 GCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCT 2526 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II 

Db 2623 GCGGTGAATGTCTTCCTGGGAATCGGTGTGGCCTGGTCCATCGCTGCCATCTACCACGCA 2682 

Qy 2527 CTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTC 2586 

III I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2683 GCCAATGGGGAACAGTTCAAAGTGTCCCCTGGCACACTAGCTTTCTCTGTCACTCTCTTC 2742 

Qy 2587 ACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGA 264 6 

II I I I I I I II I I II I I I I I I I I I I I II I I I I I I I I I I I 

Db 2743 ACCATTTTTGCTTTCATCAATGTGGGGGTGCTGCTGTATCGGCGGAGGCCAGAAATCGGA 2802 

Qy 2647 GGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTGAGCCTG 2706 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2803 GGTGAGCTGGGTGGGCCCCGGACTGCCAAGCTCCTCACATCCTGCCTCTTTGTGCTCCTA 2 862 

Qy 2707 TGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGGTTCTAA 2766 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2863 TGGCTCTTGTACATTTTCTTCTCCTCCCTGGAGGCCTACTGCCACATAAAAGGCTTCTAA 2922 
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Qy 

Db 



142 TGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAAC 201 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

145 T GT ACT GGCT CAT ATT ACT GT AAGAAAG GGGT GAT CT T GCC CAT TT GGGAACC C CAAGAC 204 



Qy 

Db 



202 CCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATG 261 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
205 C CAT CT TTT GG GGACAAAATT GCTAGAGCAACT GT GT AT T TT GT GGCCAT GGT CT ACAT G 264 



Qy 

Db 



262 TTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCATCTATTGAAGTCATCACCTCT 321 

I I I I I I I I II II II I I I I I I I 1 I I II III I I I I I I II II I II I I I I I I I 
265 TTCCTTGGAGTTTCTATTATTGCAGACCGGTTTATGTCCTCTATAGAGGTCATCACCTCT 324 



Qy 

Db 



322 CAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAAACCAGCACAACCACTATT CGG 381 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
325 CAAGAGAAAGAAATAACGAT AAAGAAAC C GAAT GGAGAGACCAC CAAGAC GAC GGT GAGA 384 



382 GTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAG 441 

I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I 

385 ATCTGGAACGAGACTGTGTCGAACCTGACCTTGATGGCCCTGGGATCTTCTGCTCCTGAG 444 

442 ATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCT 501 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

445 ATTCTCCTGTCAGTCATTGAAGTGTGCGGCCATAACTTCACCGCAGGGGACCTGGGTCCC 504 

502 TCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATCATCATTGGCATCTGTGTCTAC 561 

II I I I II II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

505 AGCACCATCGTGGGAAGTGCTGCCTTTAACATGTTCATCATAATCGCACTCTGTGTTTAC 564 

562 GTGATCCCAGACGGAGAGACTCGCAAGATCAAGCAT CTACGAGT CTTCTT CAT CACCGCT 621 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

565 GT GGT C CCT GAT G GAGAGACAAGGAAGAT CAAGCAT CT GC GT GT GT T CTT T GT GACAGCA 624 

622 GCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGT 681 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

625 GCCTGGAGCATCTTTGCCTATACCTGGCTTTATATAATCTTGTCTGTCAGCTCTCCTGGA 684 

682 GTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTG 741 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

685 GTTGTGGAGGTCTGGGAAGGCTTGCTTACTTTCTTCTTCTTTCCCATCTGCGTTGTGTTC 744 

742 GC CT GGGT GGCAGATAAAC GACT GCT CT T CT AC AAAT ACAT GC ACAAAAAGT AC C G C ACA 801 

I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I 

745 GCGTGGGTAGCAGACAGGCGGCTTCTCTTTTACAAGTATGTCTACAAGCGGTACAGGGCC 804 

802 GACAAAC ACC GAGGAATT AT CAT AGAGACAGAGGGT GAC C AC CC TAAGGGC 852 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

805 GGCAAGCAGAGGGGGAT GATCATT GAACAT GAAGGAGACAGACCAGCTT CCAAAACT GAA 864 

853 AT T GAGAT GGAT G GGAAAAT GAT GAATT C C C ATT TT CT AGAT GGGAACCT GGT GCC C CT G 912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

865 AT C GAAAT GGAT GGGAAAGT GGT CAACT CT C AT GT T GACAAT TT CT T AGAT GGGG CT CTG 924 

913 GAAGGG AAGGAAGTGGAT GAGT CCCGCAGAGAGAT GAT CCGG 954 

I I I I I I I I I I I I I I I I I I I I II 

925 GT T TT GGAAGTT GAT GAGAGGGACCAAGAT GAT GAGGAAGC C AGGC GT GAGAT GG CAAGG 984 

955 AT T CT CAAGGAT CT GAAGCAAAAAC AC C CAGAGAAGGACT T AGAT C AGCT GGT GGAGAT G 1014 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III I 

985 ATTCTGAAGGAACTTAAGCAGAAGCATCCTGAGAAAGAAATTGAGCAATTAATAGAATTA 1044 

1015 G C CAAT TACT AT GCT CT TT CCCAC C AACAGAAGAGC C G CGC CTT CT ACC GT AT C CAAGCC 1074 

I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1045 GC CAACT AC C AGGT C CT AAGT CAACAGCAGAAAAGC C GAGCATTT T ACAG GATT CAAGCT 1104 

1075 ACTCGTAT GATGACTGGT GCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAG 1134 

I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I 

1105 ACT C GCCT GAT GAC C GGAGCTGGCAACAT CTT GAAGAGGC AC GC AG CT GAT CAAG CAAGG 1164 

1135 AAGGCCT C CAGC AT GAGC GAGGT GCACAC C GAT GAGCCT G AG GAC T T TAT T T C CAAG 1191 

Mill I I I I I I I I I I III II I I I I I I I I I III 

1165 AAGGCT GT CAGT AT GCAT GAAGT CAACATGGAAAT GGCTGAAAACGACCCAGTCAGTAAG 1224 



Qy 1192 GTCTTCTTTGACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACA 1251 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1225 ATCTTCTTTGAGCAAGGAACATACCAGTGTCTAGAGAACTGTGGTACTGTGGCCCTCACC 1284 

Qy 1252 GT GGT GAGGAAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GTGGACT ACAAAAC AGAGGAT 1311 

I I I I I I I I I I I I I I I I I II I I I I I I i I I I I I I I I I I I I 
Db 1285 ATT AT GCGCAGAGGGGGC GACT T GAGC ACC ACT GT GTT T GTT GACTT C AGGACAGAAGAC 1344 

Qy 1312 GGTTCTGCCAATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCA 1371 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1345 GGCACAGC CAAT GCT GGGT CT GATT AT GAATT C AC GGAAGGGACT GT GAT CT T CAAAC C A 1404 

Qy 1372 GGAGAGAC CCAGAAGGAGTT CT C C GT GGGCATAAT T GAT GAC GAC AT T T T T GAGGAGGAT 1431 

IT HI! I III I I I I I I II M III I I I II II I II I I I I II II I II I II 
Db 1405 GGGGAGACCCAGAAGGAAAT CAGAGTTGGCAT CATTGAT GAT GAT AT CTTT GAAGAAGAT 1464 

Qy 1432 GAAC ACTT CT TT GTAAGGTT GAGCAAT GT CCGCAT AGAGGAG GAG CAGC C AGAGGAGGGG 1491 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1465 GAAAACTT C CTT GT GCAT CT T AGCAAT GT CAGAGT CT CT T CAGAT GT T T C AGAAGAT GGC 1524 

Qy 1492 ATGCCTCCAGCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGT 1551 

II III I I I I II I III I I I I I II I 

Db 1525 AT ACT AGAAT C CAAT C ACGCTTCT T CAAT T GCT T GT CT T GGGT CACCC AG C 1575 

Qy 1552 GTGGC CACAGTT AC CAT CT T GGAT GAT GAC CAT GC AGGCAT CT T CACT T TT GAAT GT GAT 1611 

Mill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1576 ACT GC CAC CATAAC C ATTT T T GAT GAT GACCAT GC AGG CATCT TT AC AT TT GAGGAACC C 1635 

Qy 1612 ACTAT T CAT GT CAGT GAGAGT AT T G GT GTT AT GGAGGT CAAGGTT CT GC GGAC AT CAGGT 1671 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1636 GTGACT CAC GT GAGCGAGAGCAT T GGCAT CAT GGAGGT GAAGGTT TT GAGAAC CT CT GGA 1695 

Qy 1672 GCC C GGGGT ACAGT CAT C GT CCC CT TT AGGACAGT AGAAG GGAC AGC CAAGGGT GGC GGT 1731 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 

Db 1696 GCT C GAGGAAATGT T ATC ATT C C CT ACAAAACT AT TGAAGGC AC AGC C C GAGGT GGAGGG 1755 

Qy 1732 GAGGACTTT GAAGACACAT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACTGT GAAAAC C 1791 

II I I I I I I I I I I I I I I III III I I I II I I I I I I I I I I I I I II I I I I I 

Db 1756 GAAGACTTTGAGGACACCTGT GGAGAGCTCGAATT CCAGAACGAT GAAATAGTCAAAACA 1815 

Qy 1792 ATAAGGGT TAAAAT AGT AGAT GAGGAGGAAT AC GAAAG GCAAGAGAATTT CT T C ATT GC C 1851 

III I I I I I I I I I II I I I I I I I I I I I I III I I I I I I I I I I 

Db 1816 ATATCAGTCAAGGTAATCGATGACGAGGAGTATGAGAAAAACAAGACCTTCTTCATTGAG 1875 

Qy 1852 CTTGGTGAACCGAAATGGAT GGAACGT GGAAT AT CAGATGTGACAGACAGGAAG 1905 

I I I I I I II I I I I I I II 

Db 1876 ATTGGAGAGCCCCGTCTGGTGGAGATGAGTGAGAAGAAAGNNNNNNNNNNNNNNNNNNNN 1935 

Qy 1906 1905 

Db 1936 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCCAACCTATCTTCAGGAAGGTCCAT 1995 

Qy 1906 1905 

Db 1996 GCTAGAGAT CAT C C GATT C C CT CT ACT GTAAT CAC CAT CT CAGAG GAAT AT GAT GACAAG 2055 



Qy 



1906 



CT GACT AT GGAAGAAGAGGAGGCCAAGAGGAT AG CAGAGAT GGGAAAGC C AGT A 1959 



1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 1 1 1 1 1 II I 

Db 2056 CAGC CACT GACCAGCAAAGAAGAGGAGGAGAGGC GCATT GCGGAAAT GGGGC GC C CC AT C 2115 

Qy 1960 T T GGGT GAACAC C C CAAACT AGAAGT CAT CAT T GAAGAGT C CT AT GAGTT CAAGACT AC G 2019 

I II II III I I I I II II II I I I I I I I I I I I I I II II I I I I I I I II 
Db 2116 CTAGGC GAGCACAC CAAGCT GGAGGT GAT CAT C GAAGAGT CT TACGAATT CAAGAGC ACT 2175 

Qy 2020 GTGGACAAACTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGG 2079 

I I I I I I I I I I I II I I I I I I I I I I I II II I I I II I I II I I I I I I I I I I I I 

Db 2176 GTGGACAAACTCATTAAGAAGACGAACCTGGCCCTTGTGGTGGGGACCAACAGCTGGAGA 2235 

Qy 2080 GACCAGTTCATGGAGGCCATCACCGT CAGT GCAGCAGGGGATGAGGAT GAGGAT GAATCC 2139 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2236 GAGCAGTTTATCGAAGCCAT CACT GT CAGC GCTGGGGAAGATGAC GAT GATGAT GAATGT 2295 

Qy 2140 GGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGG 2199 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II II I I I I I I 
Db 2296 GGGGAGGAGAAGCTGCCCTCCTGTTTTGATTACGTGATGCACTTTCTCACAGTGTTCTGG 2355 

Qy 2200 AAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCC 2259 

I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2356 AAGGTTCTGTTTGCCTTCGTCCCACCTACAGAATACTGGAATGGCTGGGCCTGCTTCATT 2415 

Qy 2260 GTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTC 2319 

I I I I I I II I I I I I I II III I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2416 GTCTCCATCCTCATGATCGGCCTACTGACCGCCTTCATTGGAGACCTGGCTTCCCACTTT 2475 

Qy 2320 GGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACC 2379 

I II I I I I I I I I I II I I I I I I I I I I I II II II I I I I I II II II I I I I III 

Db 2476 GGCTGCACCATTGGTCTGAAAGATTCCGTGACTGCCGTTGTGTTTGTTGCTCTTGGAACC 2535 

Qy 2380 T CT GT C CCAGATACGT TT GC CAGCAAAGCT GCT GC CCT C C AGGAT GT AT AT G CAGAC GC C 2439 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2536 T CGGT GCCAGACAC AT TT GC CAGCAAAGT AGC AGCT AC CC AGGAC CAGT AT GCAGAT GC G 2595 

Qy 2440 TCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCC 2499 

II II I II I I II II II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2596 TCTATAGGCAATGTCACTGGAAGCAATGCTGTGAATGTCTTCCTGGGAATCGGCGTGGCC 2655 

Qy 2500 TGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGC 2559 

I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I 

Db 2656 TGGTCCATTGCTGCCATCTACCATGCGGCCAACGGGGAACAGTTCAAAGTGTCCCCCGGC 2715 

Qy 2560 ACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTC 2619 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 
Db 2716 ACGCTAGCTTTCTCTGTCACTCTCTTCACTATTTTTGCTTTCATCAACGTGGGGGTGCTG 2775 

Qy 2620 TTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTC 2 679 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2776 CTGTATCGGCGGAGGCCAGAAATAGGAGGTGAGCTGGGAGGGCCCCGGACTGCCAAGCTC 2835 

Qy 2680 GCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAG 2739 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2836 CTCACATCTTCCCTGTTTGTGCTCCTGTGGCTCTTGTACATTTTCTTCTCCTCCCTGGAA 2895 

Qy 2740 GCCTATTGCTACATCAAGGGGTTCTAA 2766 

I I I I I III II I I I I I II I I I I I I 



Db 2896 GCCTACTGCCACATAAAGGGCTTCTAA 2922 
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AY408693 2516 bp DNA linear GSS 12-DEC-2003 

Homo sapiens HCM3309 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY408693 

AY408693.1 GI: 39764664 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2516) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T . J. , Sninsky, J. J . , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
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Science 302 (5652), 1960-1963 (2003) 
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2 (bases 1 to 2516) 
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Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
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Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2516 

/organism="Homo sapiens" 
/mol_type= "genomic DNA" 
/ db_x r e f = " t a xon : 9 6 0 6 " 
<1. ->2516 
/locus__tag="HCM3309" 



Query Match 41.6%; Score 1151.4; DB 29; Length 2516; 

Best Local Similarity 66.0%; Pred. No. 7.6e-272; 

Matches 1673; Conservative 0; Mismatches 809; Indels 51; Gaps 5; 

Qy 266 TTGGGGTGTCCATCATTGCTGACCGCTTCATGGCATCTATTGAAGTCATCACCTCTCAAG 325 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I III 

Db 1 T GGGAGT GT C CAT CAT C GC C GAC CGTTT CAT GGC GGC CAT C GAG GT CAT C AC GT CAAAAG 60 

Qy 326 AGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAAAC CAGC ACAAC C ACT ATT C GGGT CT 385 

I I I I I I I I I I I I I II I I I I I I I I II I I I I III I I I I III 

Db 61 AGAAGGAGAT C AC CAT C AC CAAGGC CAAC GGT GAGAC CAGC GT GGGC AC C GT T C GC AT CT 120 

Qy 386 GGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATAC 445 

I I I I I I I II II I I I I I I I I II M I I II I I I I I I I I I I I I II I I I I I I I I I 



Db 121 GGAAT GAGAC GGT GT C CAAC CT C AC GCT CAT GGC C CT G GGCT C CT CCG C ACCT GAGAT C C 180 

Qy 446 TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 505 

I I I I I I I I I I II I I I I I I II I I I I I I I I I I II I I I I 

Db 181 TGCTGTCAGTCATCGAAGTCTGCGGCCACAACTTCCAGGCGGGTGAGCTGGGCCCAGGCA 240 

Qy 506 CCATT GT AGGGAGT GCAGCCT T CAACAT GTT C AT CAT C ATTGG CATCT GT GT CT AC GT GA 565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CCATCGTGGGCAGCGCTGCCTTCAACATGTTTGTGGTCATCGCCGTGTGCATCTACGTCA 300 

Qy 566 TCCCAGACGGAGAGACTCGCAAGATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTT 625 

I I I I I I III MM I I M I I I I I I I I I I II I I I II I I II I I I II II III 
Db 301 TCCCAGCCGGCGAGAGCCGCAAGATCAAGCACCTGAGAGTCTTCTTTGTCACTGCCTCTT 360 

Qy 626 GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 685 

I I II I I I I I I I M I I II I I I I I I I I I I I I II I I II I I I I I I I I I I I I 

Db 361 GGAGCATCTTCGCCTATGTCTGGCTTTATCTCATCCTTGCTGTTTTTTCCCCCGGTGTGG 420 

Qy 686 TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 745 

I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 421 TCCAGGTGTGGGAGGCGCTGCTGACCCTGGTCTTCTTCCCGGTGTGCGTGGTATTCGCCT 480 

Qy 746 GGGT GGC AGATAAAC GACT GCTCTT CTACAAAT AC AT GC AC AAAAAGT AC CGC ACAGACA 805 

II I I I I M II II I I I I I I I I I I I I I I III II II I I I I I I I I II III 

Db 481 GGATGGCCGACAAGCGGCTGCTCTTCTACAAGTACGTGTACAAGCGCTACCGCACCGACC 54 0 

Qy 806 AAC AC C GAGGAAT TAT CAT AGAGACAGAGGGT GAC CAC C CTAAGGGC ATT GAGAT GGAT G 865 

II I I II II I I II II I I I I I II I I I I III III II II III I I I I I 
Db 541 CACGCAGC GG C AT CAT CAT AGGCGC CGAGGGC GAC C CC C C GAAGAGC AT C GAGCT GGACG 600 

Qy 866 GGAAAAT GAT GAAT T C CCAT TTT CT AGAT GGGAA CCTGGTGCCCCTGG 913 

II III III I I I I I I I I I I I I I I 

Db 601 GCACGTTCGTGGGCGCCGAGGCCCCAGGTGAGCTGGGCGGCCTGGGCCCGGGCCCCGCCG 660 

Qy 914 AAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT C C GGATT CTCAAGGAT CT GAAGC 973 

III II I I II I II II I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 661 AGGCGCGC GAGCT GGACGCCAGCCGCCGCGAGGT CAT CC AGAT CCTCAAGGACCTCAAGC 720 

Qy 974 AAAAAC AC CC AGAGAAGGACT T AGAT C AGCT G GT GGAGAT GGC CAAT TACT AT GCT CT TT 1033 

I I I I I I I I II II I I I I I I II I I I I I I I I II I I I I I I II I I I I I I 

Db 721 AGAAGCACCCGGACAAGGATCTGGAGCAGCTGGTGGGCATCGCCAACTACTACGCGCTGC 780 

Qy 1034 C CCAC CAACAGAAGAG CC G CGCCT T CT AC CGT AT C CAAGCCACT C GT AT GAT GACT G GT G 1093 

I I I I I I I I II I I I I I II I II I I I I I I I I II II I I I I I I II I I I I II I II I 

Db 781 TGCACCAGCAGAAGAGCCGCGCCTTCTACCGCATCCAGGCCACGCGGCTGATGACCGGCG 840 

Qy 1094 C AGGCAATAT CCT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGGCCT C CAGCAT GAGC G 1153 

I I I II I I I I I II I I I I I II I I I I I I I II 

Db 841 CCGGGAACGTGCTGCGCAGACACGCGGCGGACGCCTCGCGCAGGGCGGC GCCGGCCG 897 

Qy 1154 AGGT GC ACAC C GAT GAG CCT GAGGACT TT ATTT CC AAGGT CT T CTT T GAC CCAT GTT CTT 1213 

III I I I I I I I I I I I II I II II I I I I I I 

Db 898 AGGGCGCGGGCGAGGACGAAGACGACGGCGCCAGCCGCATCTTCTTCGAGCCTAGCCTCT 957 

Qy 1214 ACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGGAAAGGGGGAGACA 1273 

I I II I I I I I II II I I II I II I I I I I II I I I I II I I I I I I I 
Db 958 ACCACTGCCTGGAGAACTGCGGCTCCGTGCTGCTGTCCGTCACGTGCCAGGGCGGCGAGG 1017 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1274 T GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGT T CT GCCAAT GCAGGGGCT G 1333 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
1018 GCAACAGCACCTT CT AC GT GGACT ACCGCACTGAGGACGGCTCTGCCAAGGCGGGCTCCG 1077 

1334 ACT ATGAGTT C AC AGAGGGCAC GGT GGT T CT GAAGC C AG GAGAGAC CC AGAAGGAGTT CT 1393 

I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1078 ACTACGAGTACAGNGAGGGCACGCTGGT GTT CAAACCAGGC GAGACGCAGAAGGAGCTGC 1137 

1394 C C GT GGGCAT AAT T GAT GAC GAC ATT TT T GAGGAGGAT GAACACT T CTTT GTAAGGTT GA 1453 

I I I I I I I II II I I I I I I I I II II I I I I I I II II I I I I I II II II 
1138 GC AT CGGC AT CAT CGAC GAC GAC AT CTT C GAGGAGGAC GAGCATT T CTTCGTGCGGCTGC 1197 

1454 GCAATGTC CGCAT AGAGGAGGAGC AGCCAGAGGAGG GGAT GC CT C C AGCAATAT T CAACA 1513 

I I I I I I I I I I I I I I I I III II 

1198 TGAACCTGCGCGTGGGCGACGCGCAGGGCATGTTCGAGCCG ; GACG 1242 

1514 GTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGG 1573 

I III II III III I I I I I I I I I I I I I I I I I I 

GCGGCGGGCGGCCCAAGGGGCGGCTGGTGGCGCCGCTGCTGGCCACCGTCACCATCCTGG 1302 



1243 



1574 AT GATGACCATGCAGGCATCTTCACTTTTGAATGT GAT ACT ATTCATGTCAGTGAGAGTA 
I I I I I II I I I I I I I I I I I I I I I I I I II I! II Ml I I 

1303 ACGACGACCACGCAGGCATCTTCTCCTTCCAGGACCGCCTGCTGCACGTGAGCGAGTGCA 

1634 TTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCC 

III I I I I I I II I I I I I II I I I I I I I I II I I III 

1363 TGGGCACCGTGGACGTGCGCGTCGTGCGCAGCTCGGGCGCGCGCGGCACCGTGCGCCTTC 



1633 



1362 



1693 



1422 



1753 



1694 C CT TT AGGAC AGT AGAAGGGAC AGC CAAGGGTGGC GGT GAG GACT TT GAAGACACATATG 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

1423 CCTACCGCACGGTGGACGGCACGGCGCGCGGCGGCGGCGTGCACTACGAGGACGCGTGCG 1482 

1754 GGGAGTTGGAATTCAAGAAT GAT GAAACTGT GAAAACCATAAGGGTTAAAATAGTAGATG 1813 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

14 83 GAGAGCTGGAGTTTGGCGACGACGAGACCAT GAAAACTCTT CAGGTGAAGATAGTT GATG 1542 

1814 AGGAGGAAT AC GAAAGGCAAGAGAATTT CT T CAT TGCCCTTGGT GAACC GAAAT GGAT GG 1873 

I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I III I I I I I 
1543 AC GAGGAATAT GAGAAAAAGGAT AATTT CT T CAT T GAGCT GGGCC AGCC C C AGT GGCT T A 1602 

1874 AAC GT GGAAT AT CAGAT GT GACA GACAGGAAGCT GACT AT GG 1915 

I I I I I I I I I I I II I I I I I I II I I I I 

1603 AGCGAGGGATTTCAGNNNNNNNNNNNNNNNNNNGGGATGGGGACAGGAAGCTAACAGCCG 1662 

1916 AAGAAGAG GAGGC CAAGAGGAT AGC AGAGAT GGGAAAGC C AGT ATT GGGT GAAC AC C C CA 1975 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 
AGGAGGAGGAGGCTCGGAGGATAGCAGAGAT GGGCAAGCCAGTT CTT GGGGAGAACTGCC 



1663 



1722 



2035 



1976 AACTAGAAGT CAT CATTGAAGAGTCCTATGAGTT CAAGACT ACGGT GGACAAACTGAT CA 

II II I I I I I I I I II I I I I I I I I I I II III 
1723 GGCTGGAGGTCATCATCGAGGAGTCATATGATTTTAAGNNNNNNNNNNNNNNNNNNNNNN 1782 

2036 AGAAGACAAAC CT GGCCT T GGTT GT GGGGAC CC ATT CCT GGAGGGAC CAGT T CAT G GAGG 2095 

1783 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1842 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



2096 CCATCACCGTCAGTGCA GC AG GGGAT GAGGAT GAGGATGAAT C CGGGGAGGAGAGGC 2152 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1843 NNNNNNNNNNNNNNNNNNGGGACGAGGAGGAGGAGGAGGACGGGTCCCGGGAGGAGCGGC 1902 



2153 



2212 



TGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTG 

I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I II I 
1903 TGCCGTCGTGCTTTGACTACGTGATGCACTTCCTGACGGTGTTCTGGAAGGTGCTCTTCG 1962 

2213 CCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCA 2272 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1963 CCTGTGTGCCCCCCACCGAGTACTGCCACGGCTGGGCCTGCTTTGGTGTCTCCATCCTGG 2022 

2273 TCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTG 2332 

I I I I III I I II II I I III I I II I I I I I III I IN II I I I I I I I I I I I I III III 
2023 TCATCGGCCTGCTCACCGCCCTCATTGGGGACCTCGCCTCCCACTTCGGCTGCACCGTTG 2082 

2333 GTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATA 2392 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2083 GCCTCAAGGACTCTGTCAATGCTGTTGTCTTCGTTGCCCTGGGCACCTCCATCCCTGACA 2142 



2393 



2143 



2453 



2203 



2513 



2263 



2573 



2323 



2633 



2383 



2693 



CGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACG 2452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGTTCGCCAGCAAGGTGGCGGCGCTGCAGGACCAGTGCGCCGACGCGTCCATCGGCAACG 2202 

TGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCG 2512 

I I I I III I I I I I I II II II I I I I I III I III I I I I I I I I I I I I I I I I 

TGACCGGCTCCAACGCGGTGAACGTGTTCCTTGGCCTGGGCGTCGCCTGGTCTGTGGCCG 2262 

CCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCT 2572 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 

CCGTGTACTGGGCGGTGCAGGGCCGCCCCTTCGAGGTGCGCACTGGCACGCTGGCCTTCT 2322 

CCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGC 2632 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

CCGTCACGCTCTTCACCGTCTTCGCCTTCGTGGGCATTGCCGTGCTGCTGTACCGGCGCC 2382 



GGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGC 

I I I I I I I I I II II I I I I I II I I I I I II II I I I I I I I I II I I II II 

GGCCGCACATCGGCGGCGAGCTGGGCGGCCCGCGCGGACCCAAGCTCGCCACCACCGCGC 



2692 



2442 



2752 



TCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACA 

I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II III III 
2443 TCTTCCTGGGCCTCTGGCTCCTGTACATCCTCTTCGCCAGCCTGGAGGCGTACTGCCACA 2502 

2753 TCAAGGGGTTCTA 2765 

II I I I I I I I I 
2503 TCCGGGGCTTCTA 2515 
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Pan troglodytes (chimpanzee) 
Pan troglodytes 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Pan. 

1 (bases 1 to 2881) 
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Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2881) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
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Adams, M.D. and Cargill,M. 
Direct Submission 
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Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualif iers 

1. .2881 

/organism="Pan troglodytes" 

/mol_type=" genomic DNA" 

/db_xref="taxon: 9598" 

<1. .>2881 

/gene="SLC8Al" 

/locus_tag="HCM0065" 



ORIGIN 



Query Match 35.4%; 
Best Local Similarity 56.4%; 
Matches 1587; Conservative 



Score 97 8.4; DB 29; 
Pred. No. 3.4e-229; 
0; Mismatches 1057; 



Length 2881; 
Indels 171; Gaps 



Qy 



Db 



109 GAC GT GCCAAGC ACAGGGCAGAACAAT GAGTC CT GTT C AGGGT CAT C GGACT GCAAGGAG 168 

II II II III I I I I I I I I I I I I I I I II II I I I I 

76 GAAAT GGAAGGAGAAGGAAAT GAAACT GGT GAAT GTACT GGAT CAT AT T ACT GTAAGAAA 135 



Qy 

Db 

Qy 

Db 

Qy 
Db 



169 GGT GT CAT C CT GC CAATCT GGT AC C C GGAGAAC C CTT C C CTT GGGGACAAGAT T GC C AGG 228 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

136 GGGGTGATTTTGCCCATTTGGGAACCCCANNNNNCTTCTTTTGGGGACAAAATTGCTNNN 195 

229 GTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGAC 288 

I I I I I I I I II I I I I I I I II I I I I 
196 GCTACT GT GTATTTT GT GGCCAT GGT CT ACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 255 

289 CGCTT CAT GGCAT CTATT GAAGT CATCACCTCTCAAGAGAGGGAGGT GACAATTAAGAAA 348 

256 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 315 



Qy 



349 C CCAAT GGAGAAAC CAGCACAAC CACT ATT CGG GT CT GGAAT GAAACT GT CT C CAAC CT G 408 



Db 



316 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 375 



Qy 409 ACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGT 468 

Db 37 6 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 435 

Qy 469 GGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC 528 

I I I I I I I I I I I I I I I I I I 

Db 436 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCATCGTGGGAAGTGCTGCATTC 495 

Qy 529 AACAT GTT CAT CAT CAT T GGCAT CT GTGT CTAC GT GAT CCCAGAC GGAGAGACT C GCAAG 588 

I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 4 96 AAT AT GT T CAT C ATTATT GCACT CT GT GTTT AT GT GGT CCCT GAC GGAGAGACAAGGAAG 555 

Qy 589 ATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGG 648 

II I I I I I I I II I I III M I I I I I I I I I III II I I I I I I I I I I I II II 

Db 556 ATTAAGCATTTGCGTGTGTTCTTTGTGACAGCAGCCTGGAGCATCTTTGCCTACACCTGG 615 

Qy 649 CTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTC 708 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 616 CTTTACATTATTTTGTCTGTCATATCTCCTGGTGTTGTGGAGGTCTGGGAAGGTTTGCTT 675 

Qy 709 ACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTC 768 

I II I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 67 6 ACTTTCTTCTTCTTTCCCATCTGTGTTGTGTTCGCTTGGGTAGCGGATAGGAGACTTCTG 735 

Qy 769 TT CT ACAAAT AC ATGCACAAAAAGT AC C GCACAGACAAAC AC C GAGGAAT TAT CAT AGAG 828 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 736 TTTTACAAGTATGTCT ACAAGAGGTATCGAGCT GGCAAGCAGAGGGGGAT GATTATTGAA 795 

Qy 829 AC AGAG GGT GAC CAC C C TAAGGGCATT GAGATGGAT GGGAAAAT GATGAAT 87 9 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 796 CATGAAGGAGACAGGCCATCTT CTAAGACT GAAATT GAAATGGACGGGAAAGT GGTCAAT 855 

Qy 880 TCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 921 

I I I I I I I I I I I I I I I I III 

Db 856 TCTCATGTTGAAAATTTCTTAGATGGTGCTCTGGTTCTGGAGGTGGATGAGAGGGACCAA 915 

Qy 922 GAAGT GGAT GAGT CC C GCAGAGAGAT GAT CC GGATT CT CAAGGAT CT GAAGCAAAAAC AC 981 

III MM I I I I M II I I I II I I I I I M I II I II I I I I II 

Db 916 GATGAT GAAGAAGCTAGGCGAGAAAT GGCTAGGATTCT GAAGGAACTTAAGCAGAAGCAT 975 

Qy 982 C C AGAGAAGGACT T AGAT C AGCT GGT GGAGAT GGC CAAT TACT AT GCT CT TT C CCAC CAA 1041 

I I II I I I II I II I I I I III I I I M II I I I II I I II 

Db 976 C C AGAT AAAGAAAT AGAG CAATTAAT AGAAT T AGCTAACT ACCAAGT CCTAAGT CAGC AG 1035 

Qy 1042 C AGAAGAGC C G C GC CT T CTAC C GT AT C CAAGC CACT C GT AT GAT GACT GGT G CAGGCAAT 1101 

MUM I M I I I I I I II I I II I II I I I I I I M I II I I I II I M 

Db 1036 C AAAAAAGT AGAGCAT T T TAT C G C ATT CAAGCT ACT C GC CTC AT GACT GGAGCTGGCAAC 1095 

Qy 1102 AT CCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGC CT CCAGCAT GAGCGAGGT GCAC 1161 

II I II M I I I I I I I I II I I I I I I II M II I M I I II I II I I I II 

Db 1096 ATT TT AAAGAGGCAT GCAGCT GAC CAAGCAAG GAAGG CT GTC AGCAT GC ACGAGGT CAAC 1155 

Qy 1162 ACCGATGAGCCTG AGGACT TT ATTT CCAAGGT CT T CT TT GAC C CAT GT T CTT AC C AG 1218 

M I I I I I II I I I I I II I II I I II I I I I I I I I I I I I I II 

Db 1156 ACT GAAGT GACT GAAAAT GACC CT GTT AGT AAGAT CT T CT TT GAACAAG G GACATAT C AG 1215 



Qy 1219 T GC CT GGAGAACT GT GG GG CT GT ACT C CT GACAGT GGT GAGGAAAGGGGGAGACAT GT CA 1278 



1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II I I I I III II II III 

Db 1216 TGTCTGGAGAACTGTGGTACTGTGGCCCTTACCATTATCCGCAGAGGTGGTGATTTGACT 1275 

Qy 1279 AAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCCAATGCAGGGGCTGACTAT 1338 

II II Ml III I I I I II I I I I I I I I I I I I I II I I I I I III I I I I III 
Db 1276 AACACT GT GTTT GT T GACTT CAGAACAGAGGAT GGC AC AGCAAAT GCT GGGT CT GAT TAT 1335 

Qy 1339 GAGTT CAC AGAGGGC AC GGT GGTT CT GAAGCCAGGAGAGAC C CAGAAGGAGT T CT C C GT G 1398 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 1336 GAATTTACT GAAGGAACT GT GGT GTTTAAGC CT G GT GAGACC CAGAAGGAAAT CAGAGTG 1395 

Qy 1399 GGCATAATT GAT GAC GAC AT TT T T GAGGAGGAT GAAC ACTT CTTT GTAAGGT T GAGCAAT 1458 

II II II I I I I I II II I I I I I I I I I I I I I II I III I I I I I I I I I I I 

Db 1396 GGTATCATAGATGAT GATAT CTTT GAGGAGGAT GAAAATTTCCTTGTGCATCT CAGCAAT 1455 

Qy 1459 GTCCGCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTCCAGCAATATT CAACAGT CTT 1518 

III II II I I I I I I I I I I I III I I I I I 

Db 1456 GTCAAAGTATCTTCTGAAGCTTCAGAAGATGGCATACTGGAAGC CAATCAT 1506 

Qy 1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 1578 

I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1507 GTTTCTACACTTGCTTGCCTCGGATCTCCCNNCACTGCCACTGTAACTATTTTTGATGAT 1566 

Qy 1579 GAC CAT GCAGGCATCTT CACTTTTGAATGTGATACTATT CATGTCAGT GAGAGTATTGGT 1638 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1567 GACCAC GCAGGCAT T TT T ACT T TT GAGGAAC CT GT GACT CAT GT GAGT GAGAG CATT GGC 1626 

Qy 1639 GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTT 1698 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1627 AT CAT GGAGGTGAAAGT AT T GAGAAC AT CT GGAGCT CGAGGAAAT GTT AT C GT T C CAT AT 1686 

Qy 1699 AGGACAGT AGAAGGGACAGC CAAGGGT GGC GGT GAGGACTT T GAAGAC ACATAT G GGGAG 1758 

I II I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1687 AAAACC AT C GAAGGGACT GC CAGAGGT GGAGGN GAGGAT TTT GANN ACACT T GTGGAGAG 1746 

Qy 1759 T T GGAAT T CAAGAAT GAT GAAACT GT GAAAACC ATAAGGGT TAAAATAGTAGAT GAGGAG 1818 
I I I I I I I 

Db 1747 CTCGAATTCCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1806 

Qy 1819 GAATACGAAAGGCAAGAGAATTTCTT CATT GCCCTT GGT GAACCGAAAT GGAT GGAACGT 1878 

Db 1807 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1866 

Qy 1879 G GAAT AT C AG AT GT G AC AGAC AG GAAG 1905 

Db 1867 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1926 

Qy 1906 1905 

Db 1927 NNNNNNNGCCAACCTGTCTTCAGGAAGGTTCATGCTAGAGAACATCCGATTCTCTCTACT 198 6 

Qy 1906 CTGACTATGGAAGAAGAGGAG 1926 

I I I I I I I I I I II III 
Db 1987 GTAAT CAC CATT GCAGNN GAAT AT GATGACAAG C AG C CACT GAC CAGCAAAGAG GAAGAG 204 6 

Qy 1927 G CCAAGAGGATAGCAGAGAT GGGAAAGCCAGTAT T G GGT GAACACC C CAAACTAGAAGTC 1986 

I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



2047 GAGAG GCGCAT TGC AGAAAT GGGGC GCCC CAT C CT GGGAGAGCACAC CAAGTT GGAAGT G 2106 

1987 ATCATT GAAGAGTCCTATGAGTTCAAGACTACGGTGGACAAACTGAT CAAGAAGACAAAC 204 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I II I I I I II I I I I I I 
2107 ATCATT GAAGAATCCTATGAATTCAAGAGTACT GT GGACAAACT CATTAAGAAGACAAAC 2166 

2047 CTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATCACCGTC 2106 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2167 CTGGC CCTT GT GGT T GGGACTAAC AGCT GGAGAGAAC AGT T C ATT GAAGCTAT CACT GT C 2226 

2107 AGTGCAGCAGGGGATGAGGATGAGGATGAATCCGGGGAGGAGAGGCTGCCCTCCTGCTTT 2166 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2227 AGT GCT GGGGAAGAT GAT GACGAC GAT GAAT GT GGGGAAGAGAAGCT GCCCTCCTGTTTC 2286 

2167 GACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCC 2226 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

2287 GATTACGTGATGCACTTTCTGACTGTGTTCTGGAAGGTCTTGTTTGCCTTCGTCCCCCCT 234 6 

2227 ACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTC 228 6 

II II I I I I I I I I I I I I I I II III I I I I I I I I II I I I I I I I I I I I II 
2347 ACTGAATACTGGAATGGCTGGGCGTGTTTCATTGTCTCCATCCTCATGATTGGCCTACTG 2406 

2287 ACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCA 234 6 

II II I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I II I I II I I I I I II I 
2407 ACAGCTTTCATTGGAGACCTGGCTTCCCACTTTGGCTGCACCATTGGCCTGAAAGATTCT 2466 

2347 GTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAA 2 4 06 

II II II II II I I I I I III I I I I II II II I I I I I II I I I I I I I I I I I I 
2467 GT GACT GCAGT CGT GT T CGT C G C ACT T GGAACAT CAGT GC C AGACAC AT T T GC CAGCAAA 2526 

2407 GCT GCT GC C CT CCAGGAT GTATAT GCAGAC GC CT C C ATT GGCAAC GT GAC GGGCAGCAAC 2466 

I II III I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

2527 GT GG CAGC C AC CC AGGACC AGT AT GCAGAC GC CT C C AT AGGTAACGT C AC GGGCAGCAAC 2586 

2467 GCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCT 2526 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 
2587 GCGGTGAACGTCTTCCTGGGAATCGGTGTGGCCTGGTCCATCGCTGCCATCTACCACGCA 2 64 6 

2527 CTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTC 2586 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2647 GCCAACGGGGAACAGTTCAAAGTGTCCCCTGGCACACTAGCTTTCTCTGTCACTCTCTTC 2706 

2587 ACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGA 2 64 6 

I I I I I I I I I I I I II I I I I I I I I I I I I I II II I I 

2707 ACCATTTTTGCTTTCATCAATGTGGGGGTGCTGCTGTATCGGCGGANNCCAGAAANNNGN 2766 

2647 GGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTGAGCCTG 2706 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

2767 GGTNNNNNGGGTNGGCCCCGGACTGCCAAGCTCCTCACATNCTGCCTCTTTGTGCTCCTA 2 826 

2707 TGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGGT 2761 

I I I I I I I I II I I I I I I III I I I I I I I I I II I I I I I I I I I I 
2827 TGGCTCTTGTACATTTTCTTCTCCTCCNTGGAGGCCTACTGCCACATAAAAGGCT 2881 



RESULT 11 
CNSLT1IBJ 



LOCUS CNSLT1IBJ 1589 bp mRNA linear HTC 18-JUN-2003 

DEFINITION human full-length cDNA 5-PRIME end of clone CS0DB0O6YD18 of 

Neuroblastoma of Homo sapiens (human) . 
ACCESSION BX248763 
VERSION BX248763.1 GI:28375580 

KEYWORDS HTC. 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1589) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : f liang@lif etech . com .URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 
REFERENCE 2 (bases 1 to 1589) 
AUTHORS Genoscope. 
TITLE Direct Submission 

JOURNAL Submitted ( 13-FEB-2003 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 
COMMENT 1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 

end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and Eco RV sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 
FEATURES Location/Qualifiers 
source 1. .1589 

/organism= ,f Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DB006YD18" 
/tissue_type="Neuroblastoma" 

/note="end : 5-PRIME-Cot 10-normalized~vector pCMVSP0RT_6" 
CDS 619. .>1589 

/note="unnamed protein product" 
/ codon_start=l 
/protein_id="CAD66570. 1" 
/db_xref="GI: 28375581" 

/ trans lation="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPSTIVGSAAFNMFI I IGICVYVI PDGETRKIKHLRVFFITAAWSI FAYIWLY 
MI LAVFS PGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGI HE 
TEGDHPKGI EMDGKMMNSHFLDGNLVPLEGKEVDESRREMI RI LKDL " 

ORIGIN 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 



Query Match 35.1%; Score 971; DB 11; Length 1589; 

Best Local Similarity 100.0%; Pred. No. 1.6e-227; 

Matches 971; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 

Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
619 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 678 



Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
679 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 738 



Qy 121 AC AGGGCAGAACAAT GAGT C CT GTT C AGGGT CAT C G GACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 739 AC AGGGCAGAACAAT GAGT C CT GT T C AG GGT CAT C GGACTGCAAGGAGGGT GT CAT C CT G 798 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 799 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 858 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

II II III III II I I I III I I I I I I Ml I I I I I II I I III I I I II I I I I I I I I I I I I I III 

Db 859 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 918 

Qy 301 T CT ATT GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATTAAGAAAC CCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 919 T CT AT T GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC CCAAT GGAGAA 978 

Qy 361 AC CAGCACAAC C ACT ATT C GGGT CT GGAAT GAAACT GT CT CCAAC CT GACC CT TAT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 979 AC CAGCACAAC C ACT ATT C GGGT CT GGAAT GAAACT GTCT CCAACCT GACC CT TAT GG C C 1038 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1039 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1098 

Qy 481 AT T GCT GGT GAT CT GGGAC CT T CT ACCAT T GTAGGGAGTGCAGC CTT CAAC AT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1099 AT T GCT GGT GAT CT GGGACCT T CT AC CAT T GT AGGGAGT GCAGCCTT CAACAT GTT CAT C 1158 

Qy 541 AT C ATT GGC AT CT GT GT CT ACGT GAT CC C AGAC GGAGAGACTCGC AAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I 
Db 1159 ATCATTGGCAT CTGTGTCTACGTGAT CCCAGACGGAGAGACTCGCAAGATCAAGCAT CTA 1218 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 
Db 1219 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1278 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1279 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1338 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1339 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1398 

Qy 781 AT G CACAAAAAGT AC C GC ACAGACAAAC AC C GAGGAAT TAT CAT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1399 AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CAT AGAGAC AGAGGGT GAC 1458 

Qy 841 CACCCTAAGGGCATT GAGAT GGATGGGAAAATGAT GAATTCCCATTTT CT AGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1459 C AC C CT AAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT CC C ATTTT CT AGAT G GGAAC 1518 

Qy 901 CT GGTGCC C CT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT C C G GAT T CT C 960 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 

Db 1519 CT GGT GC CC CT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGATGAT CC G GATT CT C 1578 



Qy 961 AAGGAT CT GAA 971 

I II I I I I I I I I 
Db 1579 AAGGAT CT GAA 1589 



RESULT 12 

AK048160 

LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 



Craniata; Vertebrata; Euteleostomi ; 
Sciurognathi; Muridae; Murinae; Mus . 



AK048160 3573 bp mRNA linear HTC 20-SEP-2003 

Mus musculus 16 days embryo head cDNA, RIKEN full-length enriched 
library, clone : C130038C08 product : solute carrier family 8 
(sodium/ calcium exchanger), member 1, full insert sequence. 
AK048160 

AK048160.1 GI: 26339181 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Rodentia; 
1 

Carninci,P. and Hayashizaki, Y. 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki, Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K., Itoh,M., Aizawa,K., Nagaoka,S., Sasaki, N. 
Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H. 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine,T., 
Yamamoto,R., Matsumoto, H . , Sakaguchi, S . , Ikegami,T., 
Fujiwake,S., Inoue,K., Togawa,Y., Izawa,M., Ohara,E. 



Carninci, P. , 

Itoh,M. , 
Harada, A. , 
Kashiwagi, K. , 
Watahiki,M., 



Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J., 

Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 

RIKEN integrated sequence analysis (RISA) system — 384-format 

sequencing pipeline with 384 multicapillary sequencer 

Genome Res. 10 (11) > 1757-1771 (2000) 

20530913 

11076861 

4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 



of 60,770 full-length cDNAs 

JOURNAL Nature 420, 563-573 (2002) 
REFERENCE 6 (bases 1 to 3573) 

AUTHORS Adachi,J., Aizawa,K., Akimura, T . , Arakawa,T., Bono,H., Carninci,P., 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto, K. , Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M., Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M. , Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H., Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D. , Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A., Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 

TITLE Direct Submission 

JOURNAL Submitted ( 16- JUL-2001 ) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res @gsc . riken. go . jp, 
URL :http: //genome. gsc. riken. go. jp/, Tel : 81-45-503-9222 , 
Fax:81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URL : http : //genome . gsc . riken . go . jp/ 
URL : http : //f antom. gsc . riken . go . jp/ . 
FEATURES Location/Qualifiers 
source 1. .3573 

/organism= H Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J M 

/db_xref="FANTOM_DB:C130038C08 M 

/db_xref="MGI : 2414212" 

/db_xref="taxon: 10090" 

/clone="C130038C08 n 

/ tissue_type="head" 

/clone_lib=" RIKEN full-length enriched mouse cDNA library" 
/dev_stage=" 16 days embryo" 
CDS <1. .2122 

/note="unnamed protein product; putative 

solute carrier family 8 (sodium/calcium exchanger), member 

1 (MGD | MGI: 107956, GB | NM_011406, evidence: BLASTN, 99%, 

match=1583)" 

/codon_start=2 

/protein_id="BAC33262 . 1" 

/db__xref="GI: 26339182" 

/ translation="EITIKKPNGETTKTTVRIWNETVSNLTLMALGSSAPEILLSVIE 
VCGHNFTAGDLGPSTIVGSAAFNMFI 1 1 ALCVYWPDGETRKI KHLRVFFVTAAWS I F 
AYTWLYI ILSVS S PGWEVWEGLLT FFFFPI CWFAWVADRRLLFYKYVYKRYRAGKQ 
RGMI I EHEGDRPASKTEI EMDGKWNSHVT3NFLDGALVXEVDERDQDDEEARREMARI 
LKELKQKHPEKEIEQLIELANYQVLSQQQKSRAFYRIQATRLMTGAGNILKRHAADQA 
RKAVSMHEVNMEMAENDPVSKIFFEQGTYQCLENCGTVALTIMRRGGDLSTTVFVDFR 



TEDGTANAGSDYEFTEGTVI FKPGETQKEI RVGI I DDDI FEEDENFLVHLSNVRVSSD 
VSEDGILESNHASSIACLGSSSTATITIFDDDHAGIFTFEEPWHVSESIGIMEVKVL 
RT S GARGNVI I P YKT I EGTARGGGEDFEDTCGELEFQNDEI VKT I S VKVT DDEE YEKN 
KTFFIEIGEPRLVEMSEKKGGFTLTEEYDDKQPLTSKEEEERRIAEMGRPILGEHTKL 
EVIIEESYEFKSTVDKLIKKTNLALWGTNSWREQFIEAITVSAGEDDDDDECGEEKL 
PSCFDYVMHFLTVFWKVLFAFVPPTEYWNGWACFI VS I LMI GLLTAFI GDLASHFGCT 
IGLKDSVTAWFVALGTSVPGPTL" 



ORIGIN 



Query Match 34.3%; Score 948.4; DB 11; Length 3573; 

Best Local Similarity 67.8%; Pred. No. 9.6e-222; 

Matches 1434; Conservative 0; Mismatches 616; Indels 66; Gaps 5; 

Qy 331 GAGGT GACAAT TAAGAAAC CCAAT GGAGAAACCAGC ACAAC CACT AT TC GGGT CT GGAAT 390 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 GAAATAACGATAAAGAAACCGAAT GGAGAGACCACCAAGACGACGGT GAGAAT CTGGAAC 61 

Qy 391 GAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTC 450 

II I I I I I II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I 
Db 62 GAGACTGTGTCGAACCTGACCTTGATGGCCCTGGGATCTTCTGCTCCTGAGATTCTCCTG 121 

Qy 451 TCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATT 510 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 122 T CAGT C ATT GAAGT GT GC GGCCATAACT T CACC GC AGGGGAC CT G GGT C C C AGCAC CAT C 181 

Qy 511 GT AGGGAGT GCAGCCTT CAAC AT GT T CAT CATC AT T GGC AT CT GT GT CT AC GT GAT C C CA 570 

II II I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I 
Db 182 GTGGGAAGTGCTGCCTTTAACATGTTCATCATAATCGCACTCTGTGTTTACGTGGTCCCT 241 

Qy 571 GAC GGAGAGACT C GCAAGAT CAAGCAT CTAC GAGT CTT CT T CAT CAC CGCT GCT T GGAGT 630 

II I I I I I I I I I I I I I II I I I I I I I I II II I I I I I I II II II I I I I I 
Db 242 GAT GGAGAGACAAGGAAGAT CAAGCAT CT GC GT GT GTT CT T T GT GAC AGCAGC CT GGAGC 301 

Qy 631 ATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAG 690 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I II 
Db 302 ATCTTTGCCTATACCTGGCTTTATATAATCTTGTCTGTCAGCTCTCCTGGAGTTGTGGAG 361 

Qy 691 GTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTG 750 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 362 GTCTGGGAAGGCTTGCTTACTTTCTTCTTCTTTCCCATCTGCGTTGTGTTCGCGTGGGTA 421 

Qy 751 GC AGATAAACGACT GCT CTT CTACAAAT ACAT GCACAAAAAGT AC C GCAC AGACAAAC AC 810 

II I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 422 GCAGACAGGCGGCTTCTCTTTTACAAGTATGTCTACAAGCGGTACAGGGCCGGCAAGCAG 481 

Qy 811 C GAGGAATT ATC AT AGAGACAGAGGGTGAC CAC C C T AAGGGCATT GAGAT G 861 

I I I I I I I I I I I I I I I I II I II I I I I I I I I I 

Db 482 AGGGGGAT GAT C ATT GAACAT GAAGGAGAC AGAC CAGCT T C CAAAACT GAAAT C GAAAT G 541 

Qy 862 GAT GGGAAAAT GAT GAAT T C CCAT TT TCT AGAT GG GAAC CT GGTGCCCCTGG 913 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 542 GATGGGAAAGTGGTCAACTCTCATGTTGACAATTTCTTAGATGGGGCTCTGGTTTTGGAA 601 



Qy 914 
Db 602 



AAGGGAAGGAAGT GGAT GAGTCCCGCAGAGAGAT GATCCGGATTCT CAAG 

I I II I I I I I III I I I I I I I I I I I I I I I I I 

GTT GATGAGAGGGACCAAGATGATGAGGAAGCCAGGCGTGAGAT GGCAAGGATTCT GAAG 



963 
661 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



964 GAT CT GAAG CAAAAACAC C CAGAGAAGGACTTAGAT CAGCT GGT GGAGAT GGC CAAT T AC 1023 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 
662 GAACTT AAG C AGAAGCAT CCT GAGAAAGAAATT GAGCAATT AAT AGAAT T AGCCAACT AC 721 



1024 TATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATG 1083 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

722 C AG GT C CTAAGT CAACAGCAGAAAAGCCGAGCAT TTT ACAGGATT C AAGCT ACT CG CCT G 



781 



1084 AT GACT GGT GCAGGCAAT AT CCT GAAGAAAC ATGC AGCAGAACAAGC CAAGAAGGC CT CC 1143 
I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

782 AT GACC GGAGCT GGCAAC AT CTT GAAGAGGC AC GC AGCT GAT CAAGCAAGGAAGGCT GTC 841 

1144 AGCAT GAGCGAGGT GCAC ACC GAT GAGC CT G AGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I III II II III II I III I I I I I III MINIM 

842 AGT ATGCAT GAAGT CAAC AT GGAAAT GGCT GAAAAC GAC C C AGT CAGT AAGAT CTT CT TT 901 



1201 GAC C CAT GTT CTT ACCAGT GCCT GGAGAACT GT GGGGCT GT ACT CCT GAC AGT GGT GAGG 1260 
I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I III 
902 GAG CAAGGAACAT ACCAGT GT CT AGAGAACT GT GGT ACT GT GGCC CT CAC C ATTAT GC GC 



961 



1261 AAAGGGGGAGACAT GT CAAAGACCATGTAT GTGGACTACAAAACAGAGGATGGTTCT GCC 1320 

I I I I I I I I I I I I I II MINIMUM I I II I I I I I I I II 

962 AGAGGGGGCGACTTGAGCACCACTGTGTTTGTTGACTTCAGGACAGAAGACGGCACAGCC 1021 

1321 AAT G CAGGGGCT GACT AT GAGT T CAC AGAGG GCAC GGT GGT T CT GAAGC C AGGAGAGAC C 1380 

II II I III I I II I I II I I II I I II II II III I I II I II II I II I I I 
1022 AAT GCT GGGT CT GATTAT GAATT C AC GGAAG GGACT GT GAT CTT CAAAC C AGGGGAGACC 1081 

1381 CAGAAGGAGTTCT CCGT GGGCATAATTGAT GACGACATTTTT GAGGAGGATGAACACTTC 1440 

II I I I II I II II INN II I I I I I I II II II I II I I I II I I I I I I I I 

1082 CAGAAGGAAATCAGAGTT GGCATCATTGAT GAT GATATCTTT GAAGAAGATGAAAACTTC 1141 

1441 TTT GT AAGGTTGAGCAAT GT C CGCAT AGAGGAGGAGC AGC C AGAGGAGGGGAT GC CT C CA 1500 

I I II I I I I I I II I I I I II II I I I I I I II I I 

1142 CTT GT GCAT CTTAGCAAT GT C AGAGT CT CT T CAGAT GTTT CAGAAGAT GGCAT ACT AGAA 1201 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I II II II I III I I I I I I I II II I 

1202 TC CAATCACGCTTCTTCAATTGCTTGTCTTGGGTCATCCAGCACTGCCACC 1252 

1561 GTT ACC AT CT T GGAT GAT GAC CAT GC AGG CATCT T CACTT TT GAAT GT GAT ACT AT T CAT 162 0 

I II I I I II I I I II I I I I I II I I I I I I I I I I I II I I II I I III 

1253 AT AACC ATT T TT GAT GAT GAC CAT GCAGGCATC TTT ACATT T GAGGAACC C GT GACT CAC 1312 

1 62 1 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

II II II II I I I I I I I I I I I I I I I I I I I I I II I II II N M II II 
GT GAGC GAGAGCATT GGC AT C AT GGAGGT GAAGGT TTT GAGAAC CT CTGGAGCT C GAGGA 



1313 



1372 



1681 ACAGT CAT C GT C C C CTTT AG GACAGT AGAAGGGACAGCCAAGGGT G GC GGT GAGGACT TT 1740 

I II III I 1 I I I I M I I I I I I I I I I I I I II II I I I I II I I I I 

1373 AAT GTTAT CATT CC CT AC AAAACT ATT GAAG GCAC AGCC C GAGGT GGAGGG GAAGACT TT 1432 

1741 GAAGAC AC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT GAAAAC CAT AAG G GT T 1800 

I I II II I I II I I I I I II II II II I I I I I II I I II I I I I I III II 

1433 GAGGACAC CT GT GGAGAGCT CGAATT CC AGAAC GAT GAAAT AGT CAAAACAAT AT C AGT C 1492 

1801 AAAAT AGT AGAT GAGGAG GAAT AC GAAAGGCAAGAGAAT T T CTT CAT T GC C CT T GGT GAA 1860 



Db 



1493 



II I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I 

AAGGT AAT C GAT GACGAGGAGTAT GAGAAAAACAAGAC CT T CTT CATT GAGATT G GAGAG 



1552 



Qy 1861 CCGAAATGGATGGA AC GT GGAAT AT C AGAT GT G 1893 

II I I I I I I I I I I I 

Db 1553 CCCCGT CTGGT GGAGATGAGTGAGAAGAAAGGT GGCTT CACATTAACAGAGGAATATGAT 1612 

Qy 1894 ACAGAC AGGAAGCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGC AGAGAT GGGAAAG 1953 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1613 GACAAGCAGC C ACT GAC C AGCAAAGAAGAGGAGGAGAGGC GC AT T GCGGAAAT GGGGCGC 1672 

Qy 1954 CCAGT ATT GGGT GAACAC CC CAAACT AGAAGT CAT CAT T GAAGAGT CCT AT GAGTT CAAG 2013 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1673 CCCAT CCT AGGCGAGCACACCAAGCTGGAGGT GAT CATCGAAGAGT CTTACGAATTCAAG 1732 

Qy 2014 ACTACGGTGGACAAACTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCC 2073 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1733 AGC ACT GT GGACAAACT CAT TAAGAAGAC GAAC CT GGC CCTT GT GGT GGGGAC CAACAGC 1792 

Qy 2074 T GGAG GGAC C AGTTCAT G GAGGC CAT CAC C GT C AGT GCAGCAGGGGAT GAGGATGAGGAT 2133 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1793 T GGAGAGAGC AGTTT AT C GAAGC CAT CACT GT C AGC GCT GGGGAAGATGAC GAT GAT GAT 1852 

Qy 2134 GAATCCGGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTC 2193 

I II I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II II 

Db 1853 GAAT GT GG GGAGGAGAAG CT GC C CT CCTGTT T T GAT T ACGT GAT GCACTTT CT CACAGT G 1912 

Qy 2194 TTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGC 2253 

I I I I I I I I I I I I II I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1913 TTCTGGAAGGTTCTGTTTGCCTTCGTCCCACCTACAGAATACTGGAATGGCTGGGCCTGC 1972 

Qy 2254 TTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCG 2313 

III I I I I I I I I I I I I I I II III I II I I I I I I I I I I I I I I I I I I I I I II 

Db 1973 TTCATTGTCTCCATCCTCATGATCGGCCTACTGACCGCCTTCATTGGAGACCTGGCTTCC 2032 

Qy 2314 CACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTT 2373 

I I II I I I II I I I I I I I I I I I I I I I I I I I I I II II II I I I I I II II II II 

Db 2033 CACTTTGGCTGCACCATTGGTCTGAAAGATTCCGTGACTGCCGTTGTGTTTGTTGCTCTT 2092 

Qy 2374 GGCACCTCTGTCCCAG 2389 

II I I I I I II I I II 

Db 2093 GGAACCTCGGTGCCAG 2108 



RESULT 13 

BX374548 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 



BX374548 941 bp mRNA linear EST 08-MAY-2003 

BX374548 Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED Homo sapiens 
cDNA clone CS0DB006YD18 5-PRIME, mRNA sequence. 
BX374548 

BX374548.1 GI:30438490 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 941) 



Craniata ; Vertebra ta ; Euteleos tomi ; 
Catarrhini; Hominidae; Homo. 



AUTHORS 
TITLE 
JOURNAL 
COMMENT 



FEATURES 

source 



Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr f Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 7256. r For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0DB006DB09_DB1287_2&cluster=7256 . r . 
Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DB006DB09_DB1287_2 . 

Location/Qualifiers 

1. .941 

/organism="Homo sapiens" 
/mol_type= ,, mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DB006YD18" 

/tissue_type= "NEUROBLASTOMA COT 10-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 10-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 32.5%; Score 899.6; DB 13; Length 941; 

Best Local Similarity 97.7%; Pred. No. 4.6e-210; 

Matches 919; Conservative 0; Mismatches 21; Indels 1; 



Gaps 



1; 



Qy 

Db 



685 GTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCC 744 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1 GGCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCC-GTGTGTGTCCTTCTGGCC 59 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



745 TGGGT GGCAGATAAAC GACT GCT CT T CT ACAAAT ACAT GCACAAAAAGT ACC GCACAGAC 804 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
60 TGGGT GGCAGATAAAC GACT GCTCTT CTACAAAT ACAT GCACAAAAAGT AC CGCACAGAC 119 

805 AAACACCGAGGAATT AT CATAGAGACAGAGGGT GACCACCCTAAGGGCATT GAGATGGAT 864 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
120 AAACACCGAGGAATT ATCATAGAGACAGAGGGT GACCACCCTAAGGGCATT GAGATGGAT 179 

865 GGGAAAAT GAT GAATT C C C AT TT T CTAGAT GGGAAC CT GGT GCCCCT GGAAGGGAAGGAA 924 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
180 GGGAAAAT GAT GAATT CC C AT TT T CTAGAT GGGAAC CT GGT GCCCCT GGAAGG GAAGGAA 239 

925 GT GGAT GAGTCCC GC AGAGAGAT GAT C CGGATT CT CAAGGAT CTGAAGCAAAAACAC C CA 984 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
240 GT G GAT GAGT C C C GC AGAGAGAT GAT CC GGATT CT CAAGGAT CT GAAGCAAAAAC AC C C A 299 



Qy 

Db 



985 GAGAAG GACT T AGAT C AGCT G GT G GAGAT GGC CAAT TACT AT GCT CTT T CC CAC C AAC AG 1044 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
300 GAGAAGGACTT AGAT CAG CT GGT GGAGAT GGC CAATT ACT AT GCTCTTTCC CAC C AAC AG 359 



Qy 

Db 



1045 AAGAGCC GC GC CTT CT AC CGT AT CCAAGC CACT CGT AT GAT GACT GGTG CAGGCAATAT C 1104 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
360 AAGAGCC GC GCCTT CT ACC GT AT C CAAGC CACT CGT AT GAT GACT GGT G CAGGCAATAT C 419 



Qy 1105 CTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCTCCAGCATGAGCGAGGTGCACACC 1164 

I I I I I II I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 CTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCTCCAGCATGAGCGAGGTGCACACC 479 

Qy 1165 GATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTG 1224 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I II 
Db 480 GATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTG 539 

Qy 1225 GAGAACT GT GGGGCT GTACT CCT GACAGT GGT GAGGAAAGGGGGAGACAT GT CAAAGAC C 1284 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I III I I I I I I III I II I I I I I I I I I I I I I 
Db 540 GAGAACT GT GGGGCT GTACT CCT GACAGT G GT GAGGAAAGGGGGAGACAT GT CAAAGAC C 599 

Qy 1285 AT GTAT GT GGACTACAAAACAGAGGATGGTTCTGCCAAT GCAGGGGCTGACTATGAGTTC 1344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 AT GTATGT GGACTACAAAACAGAGGATGGTTCTGCCAAT GCAGGGGCTGACTATGAGTTC 659 

Qy 1345 ACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGACCCAGAAGGAGTT CT CCGTGGGCATA 1404 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 660 ACAGAGGGCAC GGT GGTT CT GAAGC CAGGAGAGACC CAGAAG GAGT T CT C CGTGGGC AT A 719 

Qy 14 05 AT T GAT GAC GAC AT TT TT GAGGAGGAT GAACACT T CT TT GTAAGGT T GAGCAAT GT CC GC 1464 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 720 AT T GAT GAC GAC AT TT TT GAGGAGGAT GAACACT T CT T T GNTAGGTT GAGCAAT GT CC GC 779 

Qy 14 65 AT AGAGGAGGAGCAGC CAGAGGAG G GGAT GC CT C CAGCAAT ATT CAACAGT CT T C C CT T G 1524 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 780 ATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTNNCAGCATATTCAAACAGT CTT CCTT G 839 

Qy 1525 CCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCAT 1584 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8 40 CCTCGGGCTGTCCTAGCCTNCCCTTGNGTGGNCACAGTTACCATCTTGGATGATGACCAT 899 

Qy 1585 GCAGGC ATCTT C ACT T TT GAAT GT GAT ACT ATT CAT GT C AG 1625 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 900 GCN AGC AT CT T C ACT T TT GAAT GT GAT ACT ATT CAT GT C AG 940 



RESULT 14 

AY408695 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



AY408695 2515 bp DNA linear GSS 12-DEC-2003 

Mus musculus HCM3309 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY408695 

AY408695.1 GI: 39764666 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 (bases 1 to 2515) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Kejariwal, A. , 
Todd, M. A. , Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 
ORIGIN 



Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 
2 (bases 1 
Clark, A. G. , 
Todd, M. A. , 
Ferriera, S 



to 2515) 

Glanowski, S. , Nielson,R., Thomas, P., Kejariwal,A. 
Tanenbaum, D .M. , Civello, D . R. , Lu,F., Murphy, B. , 
, Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 



Adams, M.D. and Cargill,M. . 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .2515 

/organism="Mus musculus" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>2515 

/locus_tag="HCM3309" 



Query Match 31.6%; Score 874.8; DB 29; 

Best Local Similarity 63.9%; Pred. No. l.le-203; 
Matches 134 8; Conservative 0; Mismatches 708; 



Length 2515; 
Indels 52; Gaps 



6; 



Qy 



Db 



691 GTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTG 750 

II I I I I I I II I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I II 
426 GTGTGGGAGGCACTGCTCACACTGATCTTCTTCCCGGTGTGTGTGGTGTTTGCCTGGATG 485 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



751 



486 



811 



GC AGAT AAAC GACT GCT CTT CT ACAAAT ACAT GC ACAAAAAGTAC C GCACAGACAAACAC 810 

II II II I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I III I I 

GCGGACAAGCGACTGCTCTTCTACAAGTACGTGTACAAGCGCTACCGCACCGACCCTCGC 54 5 



CGAGGAATTATCATAGAGACAGAGGGTGACCACCCTAAGGGCATTGAGATGGATGGGAAA 870 
I I I II I I I I I I I I I I I I I I I I I I I II III I I I I III I I I I II I I 
54 6 AGT GGAATCAT CAT CGGGGCAGAGGGAGACCCACCCAAGAGCAT CGAGCT GGACGGCACA 605 

871 ATGATGAATTCCCATTTT CTAGAT G GGAACCTGGTGCCCCTGGAAGGG 918 

III I I I I I I II III I I I I 

606 TTCGTGGGCACTGAGGTCCCTGGCGAGCTGGGCGCATTGGGCACAGGTCCTGCTGAGGCG 665 



919 



666 



979 



AAGGAAGT GGAT GAGT C C CGCAGAGAGAT GATCC GGAT T CT CAAGGATCT GAAG CAAAAA 978 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGT GAACTAGAT GCCAGCCGGCGT GAGGT CATCCAGATCCTTAAGGACTT GAAGCAGAAG 725 



C AC C CAGAGAAGGACTTAGAT CAG CT GGT GGAGAT G GC CAAT TACT AT GCT CT T T CC C AC 1038 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

726 CACCCGGATAAGGACCTGGAGCAGCTGATGGGCATCGCCAAGTACTATGCACTGCTGCAC 785 

1039 CAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGC 1098 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I III 

786 CAGCAGAAGAGCCGCGCCTTCTACCGCATCCAGGCCACGCGGCTGATGACAGGTGCGGGC 845 



Qy 



1099 AAT ATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT CCAGCAT GAGCGAGGTG 1158 



1 1 1 I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 III III II I I 

Db 846 AATGTGCTGCGCAGACATGCTGCGGATGCTGCCCGCAGGCCGGGAGCCACCGATGGTGCC 905 

Qy 1159 CAC AC C GAT GAGC CT GAGGACTTT ATTT C CAAGGT CTT C TTT GACC C AT GT T CTT AC CAG 1218 

II I I I I I I I I I I II II I I I I I I I I I I I I I I I I I 

Db 906 CCCGAT GAT GAGGAT GATGGTGCCAGTCGCA TCTTCTTTGAGCCCAGCCTCTATCAC 962 

Qy 1219 TGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGGAAAGGGGGAGACATGTCA 1278 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 963 TGCCTGGAGAACTGCGGGTCAGTGCTGCTGTCCGTGGCTTGCCAGGGTGGTGAGGGCAAC 1022 

Qy 1279 AAGAC CAT GT AT GT G GACTACAAAACAGAGGAT GGTT CT GCCAAT GC AGGGGCT GACT AT 1338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I 
Db 1023 AGCAC CTT CT ACGTGGACTAC C GT ACT GAGGAC GGT T CT GCAAAGGC AGGCT C CGAT TAT 1082 

Qy 1339 GAGT T CAC AGAGGGCAC GGT GGT T CT GAAGC C AGGAGAGACC CAGAAGGAGT T CT C C GT G 1398 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1083 GAGT ACAGC GAGGGC AC ACT GGT GT T C AAGC C C GGG GAGAC GCAGAAGGAC CT GC GCAT C 1142 

Qy 1399 GGCATAATT GAT GACGACAT TT T T GAGGAGG AT GAAC ACT T CTTT GT AAGGT T GAG CAAT 1458 

II II II II I I I I I I I I II I I I I I I I I II I I I I I I I I II III II II 

Db 1143 GGT AT CAT C GAC GACGACAT CTT C GAGGAGGAC GAGC ACTTCTT C GT GAGGCT GCT GAAC 1202 

Qy 1459 GT C C G C AT AGAGGAGGAGCAGC C AGAGGAGGGGAT G C CT CCAGCAAT AT T CAAC AGT CTT 1518 

I II I I I I I I I I I II I I I I I 

Db 1203 CTGCGTGTGGGCGATGCTCAGGGCATGTTCGAG CCCGACGGCGGT 1247 

Qy 1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 1578 

III II III III . I I I I I I I I I I I I I I I II I I I I 

Db 1248 GGGCGGCCCAAGGGGCGGCTGGTGGCGCCGCTGCTGGCCACTGTCACCATCCTGGACGAC 1307 

Qy 1579 GAC CAT GCAGGCATCT T CACTT T T GAATGT GAT ACT AT T CAT GT C AGT GAGAGT AT T G GT 1638 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1308 GACCACGCGGGCATCTTCTCCTTCCAGGACCGCCT GCT GCAT GTGAGCGAGT GCAT GGGC 1367 

Qy 1639 GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTT 1698 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1368 ACTGTGGATGTGCGCGTGGTTCGCAGCTCGGGCGCCCGTGGCACTGTACGCCTCCCCTAC 1427 

Qy 1699 AGGAC AGT AGAAGG GAC AGC CAAGGGTGGCGGT GAG GACT TT GAAGACAC AT AT GGGGAG 1758 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1428 C GCAC AGT GGAC GG C AC GGC C C GT GGCGGT GGT GT AC AT T ACGAGGATGCTT GT GGAGAG 1487 

Qy 1759 TT GGAATT CAAGAAT GAT GAAACT GT GAAAACCAT AAGGGTT AAAAT AGT AGAT GAGGAG 1818 

I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1488 CT GGAGTTCGGCGAT GAT GAGAC- CAGAAAACT CTT CAGGTCAAGATAGT GGAT GAT GAA 1546 

Qy 1819 GAAT AC GAAAGGCAAGAGAATT T CT T C ATT GC C CT T GGT GAAC CGAAAT GGAT GGAAC GT 1878 

I I I I I I I I I I I I I I I I I I I II I I I I I I III I I I I I III 
Db 1547 GAGT AT GAGAAGAAGGACAACT T CT T C ATT GAGCT GGGC CAGCC C CAGT GG CT TAAGCGA 1606 

Qy 1879 GGAAT AT CAGAT GT GAC AGACAGGAAGCT GACT AT GGAAGAA 1920 

I I I I I I II I I I I I I I I I I I I I Ml 

Db 1607 GGCATCTCAGNNNNNNNNNNNNNNNNNN GGAAT GGAGACAAGAAGATAACTGCAGAG CAG 1666 

Qy 1921 GAGGAGGCCAAGAGGATAGCAGAGATGGGAAAGCCAGTATTGGGT GAACACCC CAAACTA 1980 

111111111111111111111111111111111111 I I I II II II 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1667 GAGGAGGCC C AGAGGAT AGC AGAGATGGGCAAGC CAGTT CT T GGGGAGAACAAT C GCCT C 1726 

1981 GAAGT CAT CATT GAAGAGT C CT AT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 204 0 

II I I I I I I I I II I I I I I I I I I I II III 
1727 GAGGTCATCATCGAGGAGTCTTATGACTTTAAGNNNNNNNNNNNNNNNNNNNNNNNNNNN 1786 

2041 ACAAAC CT GGCCTT GGT TGTGGGGACCCATTCCTGGAGGGAC CAGTT CAT GGAGGC CATC 2100 

1787 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 184 6 

2101 ACCGTCAGTGCA G CAGGGGAT GAGGAT GAGGAT GAAT C C GGGGAGGAGAGGCT GC C C 2157 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1847 NNNNNNNNNNNNNGGGACGAGGAGGAGGATGAGGATGGACCTCGTGAGGAGCGGCTGCCG 1906 

2158 TCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGT 2217 

I I I II I I I I I I I II I I I I I I I I I II I I I I I I II I I I I I I I I II II II I I I I I 

1907 TCCTGCTTTGACTACGTGATGCACTTCCTGACGGTATTCTGGAAAGTTCTATTCGCCTGC 1966 

2218 GTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATT 2277 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1967 GTTCCACCCACGGAGTACTGCAATGGCTGGGCCTGCTTTGGTGTCTGCATCCTGGTCATT 2026 



2278 



2337 



GGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTC 

II I I I I I I I III I I I I II I I I I I I I I II I I I I I I II I I I I I I I II III 
2027 GGTGTGCTCACTGCCCTCATCGGAGACCTGGCCTCACACTTTGGGTGCACCGTGGGCCTC 2086 



2338 



2397 



AAAGAT T CAGT CACAGCT GTT GT TT TC GT GGCATTT GGC AC CT CT GT CC C AGAT AC GTTT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2087 AAGGACTCAGTCAACGCCGTGGTCTTCGTAGCCCTGGGCACCTCCATCCCTGACACGTTC 2146 



2398 



2457 



GCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2147 GCCAGCAAGGTGGCCGCGCTGCAGGACCAGTGTGCCGACGCGTCCATCGGTAACGTGACC 2206 



2458 GGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATC 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2207 GGCTCCAATGCGGTGAACGTGTTCCTGGGCCTGGGTGTGGCCTGGTCGGTGGCAGCGGTG 



2517 



2266 



2577 



2518 TACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTC 

I II I I I I I I I I I I I I I III I III II I I I I I I II I II I I I I I III 

2267 TACTGGGCGGTGCAGGGTCGCCCCTTCGAGGTGCGTGCAGGCACGCTGGCCTTCTCGGTC 2326 

2578 ACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCG 2 637 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2327 ACGCTGTTCACCGTCTTCGCCTTCGTGTGCATCGCAGTGCTGTTGTACCGGCGCCGGCCG 2386 



2638 



2387 



2698 



CACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTT 2 697 
II I II II I I I I I II I I I I I I I I I I I I I I I I II II I I I I I I I 

CAGATTGGCGGCGAGCTGGGCGGCCCGCGGGGACCCAAGCTGGCCACCACCGCTCTCTTC 2446 



GTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAG 

I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I II I I I 
2447 CTGGGCCTCTGGTTCCTCTACATTCTCTTCTCCAGCCTGGAGGCTTACTGCCACATCCGG 

2758 GGGTTCTA 2765 

II I I I I I 
2507 GGCTTCTA 2514 



2757 



2506 



RESULT 15 

BI913344 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BI913344 887 bp mRNA linear EST 16-OCT-2001 

603178823F1 NIH_MGC_121 Homo sapiens cDNA clone IMAGE: 5243308 5', 
mRNA sequence. 
BI913344 

BI913344.1 GI:16177710 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 887) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r@mail . nih . gov 

Tissue Procurement: Life Technologies, Inc. 

cDNA Library Preparation: Life Technologies, Inc. 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : / /image . llnl . gov 
Plate: LLAM11613 row: m column: 05 
High quality sequence stop: 782. 

Location/Qualifiers 

1. .887 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon:9606" 

/clone="IMAGE: 5243308" 

/lab_host="DH10B" 

/clone_lib="NIH_MGC_121" 

/note="Organ: brain; Vector: pCMV-SPORT6; Site_l: NotI ; 
Site_2: EcoRV (destroyed); RNA source anonymous pool of 3 
fetal brains, female age 20 weeks, female age 24 weeks, 
and male age 26 weeks. Library is oligo-dT primed and 
directionally cloned (EcoRV site is destroyed upon 
cloning). Average insert size 1.7 kb, insert size range 
0.7-3.5 kb. Library is normalized and enriched for 
full-length clones and was constructed by C. Gruber 
(Invitrogen) . Research Genetics tracking code 017. Note: 
this is a NIH_MGC Library." 



ORIGIN 



Query Match 29.4%; Score 813.8; DB 12; Length 887; 

Best Local Similarity 97.2%; Pred. No. 6.1e-189; 

Matches 860; Conservative 0; Mismatches 22; Indels 3; Gaps 3; 



Qy 916 GGGAAGGAAGT GGATGAGT CCCGCAGAGAGATGAT CCGGATTCTCAAGGAT CTGAAGCAA 975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 G GGAAG GAAGT GGAT GAGT C CCGCAGAGAGAT GAT C C GGAT T CT CAAGGAT CT GAAGCAA 60 



976 AAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAATTACTATGCTCTTTCC 1035 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I II I I I 
61 AAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGATGGCCAATTACTAT GCTCTTT CC 120 

1036 CAC CAACAGAAGAGC C GCGCCT T CT AC C GT AT CCAAGCCACTCGT AT GAT G AC T G GT GC A 1095 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

121 CAC CAACAGAAGAGCCGC GC CT T CT AC C GT AT CCAAG C CACT C GT AT GAT GACT GGT GC A 180 

1096 GGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT CCAGCAT GAGCGAG 1155 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
181 GGCAATAT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC CT C CAG CAT GAGC GAG 240 

1156 GTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTAC 1215 

III II I II II II III II III III III I I II I III I II I II III I I I I I II II III III II 
241 GTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTAC 300 

1216 C AGT GC CT GGAGAACT GT GGGGCT GT ACT C CT GAC AGT GGTGAGGAAAGGGG GAGACAT G 1275 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 C AGT GCCT GGAGAACT GT GGGGCT GT ACT C CT GAC AGTGGT GAGGAAAGG GGGAGACAT G 360 

1276 T CAAAGACCAT GTATGT GGACT ACAAAACAGAGGAT GGTTCTGCCAAT GCAGGGGCTGAC 1335 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 TCAAAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCCAATGCAGGGGCTGAC 420 

1336 TAT GAGTT CACAGAGGGCACGGT GGT T CT GAAGCC AGGAGAGAC C CAGAAGGAGT T CT C C 1395 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 TAT GAGTT C AC AGAGGGCACGGT GGTT CT GAAGCC AGGAGAGAC C CAGAAGGAGT T CT C C 480 

1396 GT GGGCAT AATT GAT GAC GAC AT T T TT GAGGAGGAT GAACACTT CTT T GTAAGGT T GAGC 1455 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
4 81 GT GGGCAT AATT GAT GACGAC AT TTT T GAGGAGGAT GAACACTT CT T T GTAAGGT T GAGC 540 

1456 AAT GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTCCAGCAAT ATT CAACAGT 1515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
541 AAT GT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTCCAGCAAT AT T CAACAGT 600 

1516 CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 1575 
I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
601 CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 660 

1576 GAT GACCAT GC AGGCAT CT T C ACT T T T GAAT GT GAT ACT ATTCAT GT C AGT GAGAGT ATT 1635 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
661 GAT GACCATGCAGGCAT CTT CACT T T T GAAT GT GAT ACT AT T CAT GT C AGT GAGAGT A- T 719 

1636 GGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCC 1695 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
720 GGT GT AAT GGAGGT CAAGGT T CT GC GGACAT CAT GT GCCCGGGGT AC AGT CAT C GT C C C C 779 

1696 TTT - AGGAC AGT AGAAGGGAC AGC CAAGGGT G GC GGT GAGGACT T T GAAGAC ACAT AT GG 1754 
III I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
780 TTT CAGGACAGGAGAAGGGACAGC CAAGGCT G CAC GCTAAGGACT T GAAGAC C CAT AT GC 839 



1755 
840 



GGAGTTGGAATTCAAGAAT GAT GAAACT GTGAAAACCATAAGGGT 1799 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
GGAGT TGGAAT T C - CGACT GGT GAACCT GT GAACAC CAT CACGGT 883 
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Job time : 6359.47 sees 
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(without alignments) 
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Title: 

Perfect score: 
Sequence : 



US-10-054-680-1 
2766 

1 atggcgtggttaaggttgca. 



. gctacatcaaggggttctaa 2766 



Scoring table: 



I DENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



3470272 seqs, 21671516995 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



6940544 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database 



GenEmbl : 



1 

2 
3 
4 
5 
6 
7 
8 
9 

10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 



gb__ba : * 
gb_htg : * 
gb_in: * 
gb__om : * 
gb_ov: * 
gbjpat : * 
gb_ph : * 
gb_pl : * 
gb_pr : * 
gb_ro : * 
gb_sts : * 
gb_sy : * 
gb_un : * 
gb_vi : * 
em_ba : * 
em_f un : * 
em_hum: * 
em_in : * 
em_mu : * 
em_om: * 
em_or : * 
em_ov: * 
em_pat : * 
em_ph : * 
em_pl : * 
em_ro : * 
em sts:* 



28 


i em 


un : * 


29 


em 


vi : * 


30 


em 


htg hum: * 


31 


em 


htg inv: * 


32 


em 


htg other : * 


33 


em 


htd THUS ' * 


34 


em 


htg pin : * 


35 


em 


htg rod : * 


36 


em_ 


_htg_mam: * 


37 


em_ 


_htg_vrt : * 


38 


em 


sy : * 


39 


( em_ 


_htgo_hum: * 


40 


em_ 


_htgo_mus : * 


41 


em_ 


_htgo_other : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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2781 


6 


AX299471 


AX299471 Sequence 
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2657.6 
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2840 
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HSA304852 


AJ304852 Homo sapi 


10 


2546.4 
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9 
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AF510503 Homo sapi 


11 
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86. 
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10 
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12 
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1784.8 


64. 
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18 
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64. 


5 


146055 


2 
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19 


1784.8 


64. 


5 
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9 


CNS01RGT 


AL160191 Human chr 


20 


1784.6 
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5 
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10 
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43 
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4 
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M57523 Dog cardiac 


44 
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RESULT 1 
AX496811 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



ORIGIN 



AX496811 2766 bp DNA linear PAT 26-SEP-2002 

Sequence 1 from Patent WO02059316. 

AX496811 

AX496811.1 GI: 23342335 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Hilbun,E. and Friddle,C,J. 

Human ion exchanger proteins and polynucleotides encoding the same 
Patent: WO 02059316-A 1 01-AUG-2002; 
LEXICON GENETICS INC (US) 

Location/Qualifiers 

1. .2766 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



Query Match 100.0%; Score 2766; DB 6; Length 2766; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2766; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 



Qy 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 



Qy 



181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 



1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT ATT GAAGT CATC AC CT CT CAAGAGAGGGAGGT GACAATTAAGAAAC CCAAT GGAGAA 360 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC C CAATGGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 AT T GCT GGT GAT CT GGGACCTT CTAC CATT GT AGGGAGT GCAGC CT T CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ATTGCT GGT GATCTGGGACCTT CTAC CATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

Qy 541 ATCATT GGCAT CT GTGT CTACGT GAT CCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 ATCATTGGCAT CT GTGT CTACGT GATCCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 ATG CACAAAAAGT ACCGC AC AGACAAACAC C GAGGAAT T ATCATAGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 ATGCACAA7WVGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 84 0 

Qy 841 CAC CCTAAGGGC ATT GAGATGGAT GGGAAAAT GAT GAAT T CC C ATTT TCT AGATGG GAAC 900 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CAC C CT AAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAAT T CC C AT T T T CT AGAT GGGAAC 900 

Qy 901 CT G GT GCC C CT GGAAGG GAAGGAAGT GGAT GAGTC CC G CAGAGAGAT GAT C C G GAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT C C CG CAGAGAGAT GAT C C G GATT CT C 960 

Qy 961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 961 AAG GAT CT GAAGCAAAAACAC C CAGAGAAGGACTT AGAT CAGC T G GT GGAGAT GGC CAAT 1020 



Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 



Db 1021 TACT AT GCT CT TT C C C AC CAAC AGAAGAGC CG CGC CTT CT AC C GT AT C CAAGCCACT CGT 1080 

Qy 1081 ATGATGACT GGTGCAGGCAAT ATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAACAT GC AG C AGAACAAGC CAAGAAGGCC 1140 

Qy 1141 T CC AGCAT GAG CGAGGT GCAC AC C GAT GAGC CT GAGGACT TT ATT T C CAAGGT CT T CTTT 1200 

I I I I I I I II I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T CC AGCAT GAGC GAGGT GCAC AC C GAT GAGC CT GAGGACT TT AT T T CCAAGGT CT T CTT T 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGG GGGAGACAT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT G GT T CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 
Db 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGATGGT T CT GC C 1320 

Qy 1321 AAT GCAGGGGCT GACT AT GAGTT C AC AGAGG GC AC GGT GGTT CT GAAGCC AGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GCAG GGGC T GACT AT GAGT T C AC AGAGG GCAC GGT GGTT CT GAAGC C AGGAGAGAC C 1380 

Qy 1381 C AGAAGGAGT T CT C C GT GG GCATAATT GAT GAC GACAT T TTT GAGGAGGATGAAC ACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTT CT CCGTGGGCATAATTGATGACGACATTTTT GAGGAGGATGAACACTTC 1440 

Qy 1441 TTT GTAAGGT T GAGCAAT GT CCGC AT AGAGGAGGAGCAGC CAGAGGAGGGGAT GC CT C C A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 TTTGTAAGGT T GAGCAAT GT C CGC AT AGAGGAGGAGCAGC CAGAGGAGGGGAT G C CT C CA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 . 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT CTT GGAT GAT GAC CAT GC AGGCAT CTT CACT TTT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GT T AC CAT CTT GGAT GAT GAC CAT GC AGGCAT CTT CACT TTT GAAT GT GATACT AT T CAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GT C AGT GAGAGT AT T GGT GT T AT GGAGGT CAAGGT T CT GC GGAC AT CAGGT GC C C GGGGT 1680 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

Qy 1741 GAAGACAC AT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAAC CAT AAGG GTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GAAGACACATATGGGGAGTTGGAATT CAAGAAT GATGAAACT GT GAAAAC CAT AAGGGTT 1800 

Qy 1801 AAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGAATTTCTT CATT GCCCTTGGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGAATTTCTT CATT GCCCTTGGT GAA 1860 

Qy 1861 CCGAAATGGAT GGAACGTGGAAT AT CAGATGT GACAGACAGGAAGCT GACTATGGAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 C CGAAATGGAT GGAACGT GGAAT AT C AGAT GT GACAGAC AGGAAG CT GAC TAT GGAAGAA 1920 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1921 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC C AGT ATT GGGT GAACAC C CCAAACT A 1980 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGCC AGT AT T GGGT GAACAC CCCAAACT A 198 0 

1981 GAAGT CAT CATT GAAGAGT CCT AT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I 
1981 GAAGT CAT CAT T GAAGAGT C CT AT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2040 

2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

2101 ACCGTCAGTGCAGCAGGGGATGAGGATGAGGATGAATCCGGGGAGGAGAGGCTGCCCTCC 2160 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 ACC GT C AGTGC AGC AGGGGAT GAGGAT GAGGAT GAAT C CGGGGAGGAGAGGCTGCCCT C C 2160 

2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 222 0 

2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 228 0 

2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 234 0 

2341 GAT T C AGT CAC AGCT GTT GT T TT C GT GGCATT T GGC AC CT CT GTC C CAGAT AC GT T T GC C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I 
2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2640 

2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 



Qy 2761 TTCTAA 2766 

llllfl 

Db 2761 TTCTAA 2766 
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Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 

I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
618 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 

61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 

I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
678 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 

121 ACAGGGCAGAACAAT GAGTCCTGTTCAGGGT CATCGGACT GCAAGGAGGGT GTCATCCTG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
738 ACAGGGCAGAACAATGAGTCCTGTT CAGGGT CATCGGACT GCAAGGAGGGT GTCAT CCTG 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7 98 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
858 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 

301 TCTATTGAAGT CAT CAC CTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
918 T CTATT GAAGT CAT CAC CT CT CAAGAGAGG GAGGT GACAATT AAGAAAC C CAAT GGAGAA 



60 



677 



120 



737 



180 



797 



240 



857 



300 



917 



360 



977 



Qy 



361 



AC CAGCACAAC C ACT AT T C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CTT AT GGC C 420 



Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 ll 1 1 ll 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

978 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 1037 



421 



CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1038 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 



481 



480 



1097 



540 



AT T GCT GGT GAT CT G GGAC CTT CT ACCATT GT AGGGAGT GC AGC CT T CAACAT GT T CATC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1098 ATTGCT GGT GAT CTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTT CAACAT GTT CATC 1157 



541 



600 



AT CATT GGCATCT GT GT CT ACGT GAT CCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1158 AT CATT GGCATCT GT GTCTACGTGAT CCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 1217 



601 



660 



CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1218 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1277 



661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1278 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1338 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 



781 



720 



1337 



780 



1397 



840 



AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGT GAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I 
1398 AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CAT AGAGACAGAGGGTGAC 1457 



841 



900 



CACCCTAAGGGCATT GAGAT GGAT GGGAAAATGAT GAATTCCCATTTTCTAGAT GGGAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1458 C ACC CT AAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT T T TCT AGAT GGGAAC 1517 



901 



960 



CT GGT GC CC CT GGAAGGGAAGGAAGT GGAT GAGT C C CGC AGAGAGAT GAT C C GGATT CT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
1518 CT GGT GC CC CTGGAAGGGAAGGAAGT GGAT GAGT C C CGC AGAGAGAT GAT C C GGATT CT C 1577 

961 AAGGAT CT GAAGC AAAAACAC C C AGAGAAGGACTT AGAT CAGCT G GT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1578 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGAT GGCCAAT 1637 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1638 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1697 

1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAAC AT GCAGC AGAACAAG C CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I 
1698 AT GATGACTGGT GCAGGCAAT ATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1757 

1141 T C CAGC AT GAGC GAGGT GC ACACC GAT GAGC CT GAGGACT TTAT T T C CAAGGT CTT CTT T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I \ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1758 T C C AGCAT GAG CGAGGT GCACAC C GAT GAGC CT GAGGACTT T AT T T C CAAGGT CT T CT TT 1817 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1818 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1877 

Qy 1261 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 1320 

I I I I I I I I I I I I I II I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1878 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAG GAT GGT T CT GC C 1937 

Qy 1321 AAT GCAGGGGCT GACT AT GAGT T CAC AGAGG GCAC GGT GGTTCT GAAG CCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1938 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 1997 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1998 CAGAAGGAGTT CT CCGTGGGCATAATT GAT GACGACATTTTTGAGGAGGAT GAACACTTC 2057 

Qy 1441 TTT GTAAGGTT GAGCAAT GT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2058 T TT GT AAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT C CA 2117 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2118 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2177 

Qy 1561 GTTACCAT CTT GGAT GAT GAC CAT GCAG GC AT CTT C ACTTTT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I 
Db 2178 GTTACCAT CTT GGAT GAT GAC CAT GC AGGCAT CTT CACTTTT GAAT GT GAT ACT AT T CAT 2237 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2238 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2297 

Qy 1681 AC AGTCAT CGT CC C CT T T AGGAC AGT AGAAGGGAC AGCCAAGGGT G GC GGT GAGGACT T T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2298 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 2357 

Qy 1741 GAAGAC ACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAAC CAT AAGGGTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2358 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACTGT GAAAAC CAT AAGGGTT 2417 

Qy 1801 AAAAT AGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CT T CAT T GC C CT T GGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2418 AAAAT AGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CT T CAT T GC C CTT GGT GAA 2477 

Qy 1861 C C GAAAT GGAT GGAAC GT GGAAT AT C AGAT GT GAC AGACAGGAAGCT GACT AT G GAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2478 C C GAAAT GGATGGAAC GT GGAAT AT C AGAT GT GAC AGACAGGAAGCT GACT AT GGAAGAA 2537 

Qy 1921 GAGGAGGC CAAGAGGAT AGC AGAGAT GGGAAAGC C AGT ATT GGGT GAACAC CC CAAACT A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2538 GAGGAGGCCAAGAGGATAGCAGAGAT GGGAAAGCCAGTATTGGGT GAACAC CCCAAACTA 2597 

Qy 1981 GAAGTCAT CATTGAAGAGTCCT AT GAGTT CAAGACTACGGT GGACAAACT GAT CAAGAAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2598 GAAGT CAT CAT T GAAGAGT C CT AT GAGT T C AAGACT AC GGT GGACAAACT GAT CAAGAAG 2657 

Qy 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2658 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2717 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2101 ACCGT CAGT GCAGCAGGGGATGAGGAT GAGGAT GAAT CCGGGGAGGAGAG GCT GCC CT CC 2160 

I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2718 ACC GT C AGT GCAGCAGGGG AT GAGGAT GAGGAT GAAT CCGGGGAGGAGAGGCT GC CCT CC 2777 

2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
2778 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2837 

2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2838 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2897 

2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2898 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2957 

2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2958 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 3017 

2401 AGCAAAGCT GCT GC C CT C CAGGAT GT AT AT GC AGACGC CT C C ATT GGCAACGT GACGGGC 24 60 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
3018 AGCAAAGCT G CT GC C CT C CAGGAT GT AT AT GC AGACGC CT C CATT GGCAAC GT GACGGGC 3077 

2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3078 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 3137 

2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I I I I I I I I I I I 
3138 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 3197 

2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3198 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 3257 

2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 



3258 



3317 



2701 



AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3318 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 3377 

2761 TTCTAA 2766 

I I I I I I 
3378 TTCTAA 3383 
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Query Match 99.9%; Score 2764.4; DB 6; Length 2966; 

Best Local Similarity 100.0%; Pred. No. 0; 
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Qy 


1 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


60 




1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I i 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 I I ! 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 




Db 


201 


ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 


260 


Qy 


61 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


120 






1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 




Db 


261 


TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 


320 


Qy 


121 


ACAGGGCAGAACAAT GAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 


180 




1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


321 


ACAGGGCAGAACAAT GAGT CCT GT T C AGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 


380 


Qy 


181 


C CAAT CT GGT AC C C GGAGAAC CCT T C CCT T GGGGACAAGAT T GC CAGGGT CAT T GT CT AT 


240 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


381 


CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 


440 


Qy 


241 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


300 






II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




Db 


441 


TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 


500 


Qy 


301 


TCT ATT GAAGT CAT CACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 


360 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 




Db 


501 


T CT ATT GAAGT CAT CACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 


560 


Qy 


361 


ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 


420 






1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 




Db 


561 


AC C AGC ACAAC CACT ATT C GGGT CT G GAAT GAAACT GT CT C CAAC CT GAC C CT TAT GG CC 


620 


Qy 


421 


CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 


480 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


621 


CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 


680 



Qy 481 ATTGCT GGTGAT CT GG GACCTT CTAC CAT T GT AGGGAGTGCAGCCTT CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 681 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 740 

Qy 541 ATCATTGGCAT CTGTGT CTACGT GAT CCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I II I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 741 AT CAT T GGCAT CT GT GT CTACGT GAT CC CAGAC GGAGAGACT C GCAAGAT CAAGC ATCTA 800 

Qy 601 C GAGT CT T CT T CAT CACC GCTGCT T GGAGT AT CTT T G C CTAC AT CT GGCT CT ATAT GATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 801 C GAGT CT T CT T CAT CAC CGCTGCTTG GAGT AT CT TT GCCT ACAT CT GGCT CT ATAT GAT T 860 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 861 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 920 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 921 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 980 

Qy 781 AT GCACAAAAAGT ACC GC AC AGACAAACACC GAGGAATTAT C AT AGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 981 AT GCACAAAAAGT ACC GCACAGACAAACAC C GAGGAATTAT C AT AGAGAC AGAGGGT GAC 1040 

Qy 841 CACC CT AAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT C C CATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1041 CACC CT AAGG GC AT T GAGAT GGAT GG GAAAAT GAT GAATT C C CATT T T CT AGAT GG GAAC 1100 

Qy 901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT CCGGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1101 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGATTCT C 1160 

Qy 961 AAGGAT C T GAAGCAAAAACACC C AGAGAAG GACT T AGAT C AGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1161 AAGGAT CT GAAGCAAAAACACCC AGAGAAGGACT T AGAT C AGCT GGT GGAGAT GGC CAAT 1220 

Qy 1021 TACTATGC^^TTCCCACC^CAGA 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ( 1/ I I I I I I II I I I I I I II I I I I I I I I I 

Db . 1221 TACT AT GCTCTTT C CC AC CAAC AGAAGAGCC (^T^fC CT T CTAC C GT AT C CAAGC C ACT C GT 128 0 

Qy 1081 AT GAT GACTGGTGCAGGCAATAT CCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1281 AT GAT GACTGGTGCAGGCAATAT CCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1340 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1341 T C CAGCAT GAGC GAGGT GCACAC C GAT GAG CCT GAGGACT TT ATTT C CAAGGT CTT CT T T 1400 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1401 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1460 

Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAGG AT GGT T CT GCC 1320 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1461 AAAGGGG GAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGT T CT GCC 1520 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 



1321 AAT GCAGGGGCTGACTATGAGTTCACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1521 AAT GCAGGGGCTGACTATGAGTTCACAGAGGGCAC GGTGGTT CT GAAGCCAGGAGAGACC 1580 

1381 C AGAAGGAGTT CT C C GT GG GCATAATTGAT GAC GACATT TTT GAGGAG GATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

1581 C AGAAGGAGT T CT C C GT GG GCAT AATT GAT GAC GAC AT T TTT GAGGAGGAT GAACACT T C 1640 

1441 T TT GTAAGGT T GAGCAAT GT CC GCAT AGAGGAGGAGCAGC CAGAGGAG GGGAT GCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1641 T TT GTAAGGT T GAG CAAT GT C C G CATAGAGGAGGAGCAG C CAGAGGAG GGGAT GCCT CCA 1700 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1 1 1 1 1 1 1 1 n 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 in Miii mi ii 1 1 1 1 1 1 1 1 1 1 1 1 it 

1701 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1760 

1561 GTTACCATCTT GGAT GATGACCATGCAGGCATCTT CACTTTTGAATGTGATACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1761 GTTACCAT CTT GGAT GATGACCATGCAGGCATCTT CACTTTT GAATGTGATACT ATTCAT 1820 

1621 GT CAGT GAGAGTATT GGT GT TAT GGAGGT CAAGGTTCT GC GGACATCAGGT GC C C GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

1821 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 188 0 

1681 ACAGT CAT CGT CC C CTTT AGGACAGT AGAAGGGAC AGCCAAGGGT GGC GGTGAGGACT T T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1881 ACAGT CAT CGT CC C CTTT AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACT TT 1940 

1741 GAAGAC ACAT AT GGGGAGT T GGAAT T CAAGAAT GATGAAACT GT GAAAAC CATAAGGGT T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1941 GAAGAC ACAT AT GGGGAGTT GGAAT T CAAGAAT GATGAAACT GT GAAAAC C ATAAGGGTT 2000 

1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT T T CTT CAT TGCCCTTGGT GAA 1860 

I II I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2001 AAAAT AGT AGAT GAG GAGGAAT AC GAAAG GCAAGAGAAT T T CTT CAT T GCCCT T GGT GAA 2060 

1861 C C GAAAT GGAT G GAACGT GGAAT AT C AGAT GT GACAGAC AGGAAGCT GAC TAT GGAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2061 CCGAAATGGATGGAACGTGGAATAT CAGAT GT GACAGAC AGGAAGCT GACTAT GGAAGAA 2120 

1921 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGCCAGT AT T GGGT GAACAC C C CAAACT A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2121 GAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGC CAGT ATT GGGT GAACAC C C CAAACT A 2180 

1981 GAAGT CAT CAT T GAAGAGT CCTAT GAGT T CAAGACT AC GGTGGACAAACT GAT CAAGAAG 2040 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2181 GAAGT CAT CAT T GAAGAGT C CT AT GAGT T CAAGACT AC GGTG GACAAACT GAT CAAGAAG 2240 

2041 ACAAAC CT GGC CT T G GTT GT GGG GAC CCATT C CT G GAGGGAC CAGTT C ATGGAGGC C AT C 2100 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 

2241 ACAAACCTGGCCTT GGTT GTGGGGACCCATTCCTGGAGGGAC CAGTT CATGGAGGCCATC 2300 

2101 ACC GT CAGT GC AGC AGG GGAT GAG GAT GAG GAT GAAT C C GGGGAGGAGAGGCT GC C CT C C 2160 

I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2301 ACCGTCAGTGCAGCAGGGGATGAGGATGAGGATGAATCCGGGGAGGAGAGGCTGCCCTCC 2360 

2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 



Db 



2361 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2420 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2421 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2480 

2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2481 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2540 

2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2541 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2600 

2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2601 AGCAAAGCT GCT GC C CT CCAGGAT GT AT AT GCAGACGC CT CC ATT GGCAAC GT GACGGGC 2660 

2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2661 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2720 

2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2721 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2780 

2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2781 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 284 0 

2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I II I II II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2841 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2900 

2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2901 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2960 

2761 TTCTAA 2766 

I I I I I I 
2961 TTCTAA 2966 
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KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 



AF510501 5250 bp mRNA linear PRI 30-OCT-2002 

Homo sapiens Na+/Ca2+ exchanger isoform 3 splice variant 2 (SLC8A3) 
mRNA, complete cds; alternatively spliced. 
AF510501 

AF510501.1 GI: 24421220 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 5250) 



AUTHORS Gabellini, N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
TITLE The human SLC8A3 gene and the tissue-specific Na(+)/Ca(2+} 

exchanger 3 isoforms 
JOURNAL Gene 298 (1), 1-7 (2002) 
MEDLINE 22294016 
PUBMED 12406570 
REFERENCE 2 (bases 1 to 5250) 

AUTHORS Gabellini, N. , Bortoluzzi , S . , Danieli,G.A. and Carafoli,E. 
TITLE Direct Submission 

JOURNAL Submitted ( 09-MAY-2002 ) Department of Biology, Unv. of Padova, via 
G. Colombo, Padova, PD 35131, Italy 
FEATURES Location/Qualifiers 
source 1. .5250 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref ="taxon : 9606" 

/chromosome="14" 

/map="14q24.2" 
gene 1. .5250 

/gene="SLC8A3" 
5 1 UTR 1. .754 

/gene="SLC8A3" 
CDS 755. .3520 

/gene="SLC8A3" 

/note= f, NCX3.2; expressed in brain and skeletal muscle; 

alternatively spliced" 

/codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3 splice variant 2" 

/protein_id="AAN60790.1" 

/db_xref="GI: 24421221" 

/trans la tion="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPSTI VGSAAFNMFI I IGICVYVI PDGETRKI KHLRVFFITAAWS I FAYIWLY 
MILAVFSPGWQWEGLLTLFFFPVCVXLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMAN Y YAL S HQQKS RAFYRI QAT RMMTGAGN I LKKHAAEQAKKAS SMS EVHT DE P E 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAIFNSLPL 
PRAVLAS PCVATVT I LDDDHAGI FT FECDT I HVS E S I G VMEVKVLRT S GARGTVI VP F 
RTV^GTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 
ERGISDVTDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKTTVDKLIKKTN 
LALWGTHSWRDQFMEAITVSAAGDEDEDESGEERLPSCFDYVMHFLTVFWKVLFACV 
P PT E YCHGWAC FAVS I L 1 1 GMLT AI I GDLAS H FGCT I GLKD S VT AWFVAFGT S VP DT 
FAS KAAALQD VYADAS I GNVT GSNAVNVFLGI GLAWS VAAI YWALQGQE FHVS AGTLA 
FSVTLFTIFAFVCISVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYILFATLEA 
YCYIKGF" 

3'UTR 3521. .5250 

/gene="SLC8A3" 

polyA_signal 5221. .5226 

/gene= M SLC8A3" 

ORIGIN 



Query Match 99.9%; Score 2764.4; DB 9; Length 5250; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2765; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 755 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 814 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 815 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 874 

Qy 121 ACAGGGCAGAACAATGAGT CCTGTTCAGGGT CAT CGGACT GCAAGGAGGGTGTCAT CCTG 180 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I 

Db 875 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCTG 934 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

II III II I II I I II III I I I III II II II I II II III I III I I I I II III III II II III 

Db 935 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 994 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 995 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 1054 

Qy 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATT AAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1055 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 1114 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1115 AC CAGC ACAAC C ACT AT T C G GGT CT GGAAT GAAACT GT CT CCAACCT GAC C CT T AT GGC C 1174 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1175 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1234 

Qy 4 81 AT T GCT GGT GAT CT GGGAC CTT CTAC CAT T GTAGGGAGT GCAGC CT T CAAC AT GT T CAT C 540 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1235 AT T GCT GGT GAT CT GGGAC CTT CTAC CAT T GTAGGGAGT GCAGC CTTCAACAT GTT CATC 1294 

Qy 541 AT CATTGGCAT CT GT GT CTACGTGATCCCAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1295 ATCATTGGCATCT GT GT CTACGT GATCCCAGACGGAGAGACT CGCAAGAT CAAGCAT CTA 1354 

Qy 601 CGAGT CT T CT T CAT CAC CGCTGCTT GGAGT ATCT T T GC CT ACAT CT GGCT CT AT AT GATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1355 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1414 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1415 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1474 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I II I I I I I I I I I I I 
Db 1475 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1534 

Qy 781 ATGCACAAAAAGT ACCGCACAGACAAACAC CGAGGAATT AT CATAGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1535 AT GCACAAAAAGT ACCG C AC AGACAAAC AC C GAGGAATT AT C AT AGAGACAGAG GGT GAC 1594 

Qy 841 C ACC CT AAGG GC AT T GAGAT GGAT GG GAAAATGAT GAAT T C C CAT TT TCTAGAT GGGAAC 900 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 

Db 1595 CACCCTAAGGGCATT GAGATGGAT GGGAAAAT GATGAATTCCCATTTTCTAGATGGGAAC 1654 

Qy 901 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT C CCGCAGAGAGAT GAT C CGGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1655 CT GGT GCCCCT GGAAGG GAAGGAAGT GGAT GAGT C CCG CAGAGAGAT GAT C CGGAT T CT C 1714 

Qy 961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGT GGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1715 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGT GGAGAT GGCCAAT 1774 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 1775 T ACTAT GCT CTTT C C C AC CAAC AGAAGAGCCGT GC CTT CTACC GT AT C C AAGC CACT C GT 1834 

Qy 1081 AT GAT GACTGGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1835 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1894 

Qy 1141 T CC AGCATGAG C GAGGT G CACAC C GAT GAGC CT GAGGACTTT ATT T C CAAGGT CTT CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1895 T CC AGCATGAG C GAGGT G CACAC C GAT GAGC CT GAGGACTTT AT TT C CAAGGT CTT CT T T 1954 

Qy 1201 GACCCATGTTCTT ACCAGT GCCT GGAGAACT GT GGGGCTGTACTCCT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1955 GACCCATGTTCTT ACCAGT GCCT GGAGAACT GT GGGGCTGTACTCCT GACAGT GGT GAGG 2014 

Qy 1261 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2015 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 2074 

Qy 1321 AAT GCAGGGGCTGACTAT GAGTT CACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2075 AATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACC 2134 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCAT AATTGATGACGACATTTTTGAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2135 CAGAAGGAGTTCTCCGTGGGCAT AATTGATGACGACATTTTTGAGGAGGAT GAACACTT C 2194 

Qy 1441 TTT GTAAGGTTGAGCAATGT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2195 TTT GT AAGGTT GAGCAAT GT C C G CAT AGAGGAGGAGCAGC C AGAGGAGGGGAT GC CT C CA 2254 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2255 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2314 

Qy 1561 GTT AC CAT CT T GGAT GAT GAC CAT GCAGGC AT CTT C ACTTTT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2315 GTT AC CATCT T G GAT GAT GAC CAT GCAGGC AT CTT C ACTTTT GAAT GT GAT ACT AT T CAT 2374 

Qy 1621 GT CAGT GAGAGT AT T GGT GT TAT GGAGGT CAAGGT T CT GCGGACAT C AGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2375 GT CAGT GAGAGT AT T G GT GTT AT GGAGGT CAAGGT T CT GC GGACAT C AG GTGCCCGGGGT 2434 

Qy 1681 ACAGT CATC GT CCC CT T T AGGAC AGT AGAAG GGAC AGC CAAGGGT G G C GGT GAGGACT T T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2435 AC AGTC AT C GT CC C CTTT AGGAC AGTAGAAGGGACAGCCAAGGGT GGCGGT GAGGACT TT 2494 

Qy 1741 GAAGACAC AT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAACCATAAGGGTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I 
Db 2495 GAAGACAC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT GAAAAC C AT AAGGGTT 2554 

Qy 1801 AAAAT AGT AGAT GAGGAG GAAT AC GAAAG GCAAGAGAAT TT CTT C AT TGCCCTTGGT GAA 1860 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2555 AAAAT AGT AGAT GAGGAGGAAT ACGAAAGGCAAGAGAAT T T CTT C ATT GC C CTT GGT GAA 2614 

Qy 1861 C C GAAAT GGATGGAACGT GGAAT AT CAGAT GT GAC AGAC AGGAAGCT GACT AT GGAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2615 C C GAAAT G GATGGAACGT GGAAT AT CAGAT GT GAC AGAC AGGAAGCT GACT AT GGAAGAA 2674 

Qy 1921 GAGGAGGCCAAGAG GAT AGC AGAGATGG GAAAGC C AGT AT T GGGT GAACAC C CCAAACTA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2675 GAG GAGGC CAAGAGGAT AGC AGAGAT GGGAAAGC C AGT AT T G GGT GAACACC C CAAACTA 2734 

Qy 1981 GAAGT CAT CAT T GAAGAGT C CT AT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2735 GAAGTCATCATTGAAGAGT CCTAT GAGTT CAAGACTAC GGT GGACAAACT GAT CAAGAAG 2794 

Qy 2041 ACAAAC CT GGC CT T GGT T GT GGGGAC CC AT T CCT G GAGGGAC C AGT T CAT G GAGGC CAT C 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2795 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2854 

Qy 2101 AC C GT CAGT GC AGC AGGGGATGAGGATGAGGAT GAAT C C GGG GAGGAGAGGCT GC C CT CC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2855 AC C GT CAGT GCAG C AGGGGAT GAGGATGAGGAT GAAT C C GGGGAGGAGAGG CT GC C CT CC 2914 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2915 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2974 

Qy 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2975 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 3034 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3035 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 3094 

Qy 2341 GAT T CAGT C ACAGCT GT T GT T T T C GT GGCAT TT GGCAC CT CT GT C C CAGAT AC GT T T GCC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 3095 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 3154 

Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3155 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 3214 

Qy 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 
Db 3215 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 3274 

Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3275 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 3334 



Qy 

Db 



2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I 1 I I I I I I I I I I I I I 
3335 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 



2640 
3394 



Qy 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3395 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 3454 

Qy 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3455 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 3514 

Qy 2761 TTCTAA 2766 

MINI 

Db 3515 TTCTAA 3520 



RESULT 5 
AX476818 
LOCUS 

DEFINITION 
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KEYWORDS 
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ORGANISM 
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JOURNAL 

FEATURES 

source 



ORIGIN 



AX476818 2782 bp 

Sequence 1 from Patent WO0233086. 
AX476818 

AX476818.1 GI: 22216098 



(human) 



DNA 



linear PAT 12-AUG-2002 



Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Merkulov, G. V. , Ketchum, K. A. , Shao,W., Yan,C, di Francesco, V. and 
Beasley, E.M. 

Isolated human transporter proteins , 
encoding human transporter proteins, 
Patent: WO 0233086-A 1 25-APR-2002; 
PE Corporation (NY) (US) 

Location/Qualifiers 

1. .2782 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db xref="taxon:9606" 



nucleic acid molecules 
and uses thereof 



Query Match 99.8%; 
Best Local Similarity 99.9%; 
Matches 2763; Conservative 



Score 2761.2; DB 6; 
Pred. No. 0; 
0; Mismatches 3; 



Length 2782; 
Indels 0; 



Gaps 



0; 



Qy 

Db 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 



Qy 

Db 

Qy 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 
70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 



121 AC AGGG CAGAACAAT GAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



180 



Db 130 ACAGGGC AGAACAAT GAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 189 

Qy 181 C CAAT CT GGT AC C C GGAGAACC CT T C C CT T GGGGACAAGATT GC CAGGGT CATTGT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 190 C CAAT CT GGT AC C CGGAGAACC CT T C CCT T GGGGACAAGATT GC CAGGGT CATT GT CT AT 249 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

Qy 301 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATT AAGAAACC CAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 310 T CT ATT GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAACC CAAT GGAGAA 369 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 370 AC CAGC ACAACC ACT AT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CT T AT GGCC 429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 89 

Qy 4 81 AT T GCT GGT GAT CT GGGAC CT T CT AC CAT T GT AGGGAGT G CAGC C T T CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 90 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 549 

Qy 541 AT CAT T GGC AT CT GT GT CT ACGT GAT C C C AGAC GGAGAGACT C GCAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 550 AT CATTGGCATCTGTGT CT ACGTGATCCCAGACGGAGAGACT CGCAAGAT CAAGCAT CTA 609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 789 

Qy 781 AT GCACAAAAAGT ACCGCACAGACAAACAC CGAGGAATT ATCATAGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 790 AT GCACAAAAAGT AC CGCACAGACAAACAC C GAGGAAT TAT C AT AGAGACAGAGGGT GAC 849 

Qy 841 CACC CT AAGGGC AT T GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT TT T CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 850 CAC C CTAAG GGC AT T GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT T T TCT AGAT G GGAAC 909 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGA^GTC 960 

I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I If I mi 
Db 910 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT C C GGSjYTCy T C 96£ 

Qy 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCTGGT GGAGATGGCCAAT 1020 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 970 AAGGAT CT GAAGCAAAAAC ACC CAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1029 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 



1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1089 

1081 AT GAT GACTGGT GCAGGCAAT AT C CT GAAGAAACAT GC AG C AGAACAAGCCAAGAAGG CC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1090 AT GAT GACT GGT GCAGGCAAT AT C C T GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1149 

1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1150 T C CAGCAT GAGC GAGGT GCACAC C GATGAGC CTGAGGACTT T AT TT C CAAGGT CT T CTT T 1209 

12 01 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1210 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1269 

1261 AAAGGG G GAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAGGATGGT T CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1270 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGATG GT T CT GC C 



1329 



1321 



AAT GCAGGGGCT GACT AT GAGTT C ACAGAGGGCACGGT GGTT CT GAAGC CAGGAGAGAC C 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1330 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGACC 1389 

1381 CAGAAGGAGTTCT CCGT GGGCATAATTGATGACGACATTTTT GAGGAGGATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1390 CAGAAGGAGTTCT CCGT GGGCATAATTGATGACGACATTTTT GAGGAGGATGAACACTT C 1449 

1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1450 T T TGTAAGGT T GAGCAAT GT CC GCAT AGAGGAGGAGC AGC C AGAGGAGGGGAT GC CT CC A 1509 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

1561 GTTACC AT CT T G GAT GAT GACCAT G C AGGCAT CT T C ACTTT T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1570 GTTACC AT CT T GGAT GAT GAC CAT G C AGGCAT CT T CACT TT T GAAT GT GAT ACT AT T CAT 1629 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1630 GT CAGT GAGAGT ATT GGT GT T AT GGAGGT CAAGGT T CT GC GGAC AT CAG GT GCC C GGGGT 1689 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I 
1690 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1749 

1741 GAAGACACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GT GAAAACCAT AAGGGTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1750 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAACCAT AAGGGTT 1809 

1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGC AAGAGAATT T CTT CAT T GC CCT T GGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1810 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAATTT CTT CAT T GC CCTT G GT GAA 1869 



Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 



1861 C C GAAAT GGAT GGAAC GT GGAAT AT C AGAT GT GACAGAC AGGAAGCT GACT AT G GAAGAA 1920 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1870 C C GAAAT GGAT GGAAC GT GGAAT AT C AGAT GT GACAGACAGGAAG CT GACT AT GGAAGAA 1929 

1921 GAGGAGGCCAAGAGGATAGCAGAGATGGGAAAGCCAGTATTGGGTGAACACCCCAAACTA 1980 

I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
1930 GAGGAGGCCAAGAGGATAGCAGAGAT GGGAAAGC CAGT ATT GGGT GAAC AC C CCAAACT G 1989 

1981 GAAGTCATCATTGAAGAGT CCTAT GAGTT CAAGACTACGGTGGACAAACTGATCAAGAAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1990 GAAGTCATCATTGAAGAGTCCTATGAGTTCAAGACTACGGTGGACAAACTGATCAAGAAG 2049 

2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I It It I I I III I III III M Mill II III II III lit I! II I I I III I I I I I III II 
2050 ACAAACCT GGC CT T GGT TGTGGGGACC CAT TCCTGGAGGGAC CAGT T CAT GGAGGC CATC 2109 

2101 AC C GT C AGT GCAG C AGGGGAT GAGGAT GAGGAT GAAT CCGGGGAGGAGAGGCT GCC CT C C 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2110 ACCGTCAGTGCAGCAGGGGAT GAGGAT GAGGAT GAAT CCGGGGAGGAGAGGCT GCCCTCC 2169 

2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2170 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2229 

2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2230 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 228 9 

2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2290 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2349 

2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2350 GATTCGGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2409 

2401 AGCAAAGCT GCTGCCCTC C AGGAT GT AT AT GCAGAC GCCT CCATTGG CAAC GT GAC GGGC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2410 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2469 

24 61 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2470 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2529 

2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2530 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2589 

2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 264 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2590 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2649 

2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2650 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2709 

2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 



1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2710 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2769 



Qy 2761 TTCTAA 2766 

I I I I I I 

Db 2770 TTCTAA 2775 
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LOCUS 
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KEYWORDS 
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ORGANISM 
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REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



FEATURES 
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gene 
CDS 



HSA304853 2837 bp mRNA linear PRI 06-JUN-2001 

Homo sapiens mRNA for sodium/ calcium exchanger , SCL8A3, alternative 
splice form B (SCL8A3 gene) . 
AJ304853 - - - 
AJ304853. 1 GI: 14330384 

alternative splicing; form B; SCL8A3 gene; SCL8A3 protein; 
Sodium/calcium exchanger. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Gabellini,N. 

Characterization of the human SCL8A3 gene for solute carrier family. 

8, member 3 (sodium/ calcium exchanger) 

Unpublished 

2 (bases 1 to 2837) 

Bortoluzzi, S . 

Direct Submission 

Submitted ( 22-DEC-2000 ) Bortoluzzi S., Department of Biology and 
Department of Biological Chemistry, University of Padova, via G. 
Colombo 3, 35131 PADOVA, ITALY 

Location/Qualifiers 

1. .2837 

/organism= M Homo sapiens" 
/mo^type^'mRNA" 
/db_xref="taxon: 9606" 
/ ch r omo s ome= "14" 
/map="14q24.1" 

I. .2837 
/gene="SCL8A3" 
63. .2837 
/gene="SCL8A3" 

/function=" sodium/ calcium exchanger" 

/note="alternative splice form B (exons 2, 4, 5, 9, 10, 

II, 12)" 
/codon_start=l 

/product="sodium/calcium exchanger SCL8A3" 

/protein_id="CAC40985.1" 

/db_xref="GI: 14330385" 

/db_xref="GOA:Q96QGl" 

/ db_x r e f = " S PTREMBL : Q9 6QG1 " 

/ trans la tion="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREWIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPSTIVGSAAFNMFIIIGICVYVIPDGETRKIKHLRVFFITAAWSIFAYIWLY 
MI LAVFSPGWQWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGI I IE 



TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKASSMSEVHTDEPE 
DFISKVFFDPCSYQCLENCGAVLLTVVRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGI I DDDI FEEDEHFFVRLSNVRI EEEQPEEGMPPAI FNSLPL 
PRAVLAS PCVATVTI LDDDHAGI FTFECDTI HVS ES I GVMEVKVLRTSGARGTVI VP F 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 
ERGI SALLLS PDRKLTMEEEEAKRI AEMGKPVLGEHPKLEVI I EES YEFKTTVDKLI K 
KTNLALVVGTHSWRDQFMEAITVSAAGDEDEDESGEERLPSCFDYVMHFLTVFWKVLF 
ACVP PTEYCHGWACFAVS I LI I GMLTAI I GDLASHFGCT I GLKDSVTAWFVAFGTS V 
PDT FAS KAAALQDVYADAS I GNVTGSNAVNVFLGI GLAWS VAAI YWALQGQE FHVS AG 
TLAFSVTLFTI FAFVCI SVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYI LFAT 
LEAYCYIKGF" 

ORIGIN 

Query Match 99.0%; Score 2737.4; DB 9; Length 2837; 

Best Local Similarity 99.5%; Pred. No. 0; 

Matches 2760; Conservative 0; Mismatches 6; Indels 9; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 63 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 122 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 123 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 182 

Qy 121 ACAG GGCAGAACAATGAGT C CT GT T CAGGGT CAT C G GACT GCAAGGAGGGTGT CAT CCT G 180 

I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 183 ACAGGG CAGAACAATGAGT C CT GT T CAG GGT CAT C GGACT GCAAGGAGGGTGT CAT CCT G 242 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 243 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 302 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 303 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 362 

Qy 301 T CT ATT GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 363 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 422 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 423 AC CAGC ACAAC C ACT ATT C GGGT CT GGAAT GAAACT GT CT C CAACCT GAC CCTTAT GG C C 482 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 483 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 543 AT T GCT GGT GAT CT GGG AC CTT CT AC CAT T GT AG GGAGT G CAGC CT T CAACAT GT T CAT C 602 

Qy 541 ATCATTGGCAT CT GTGT CTACGT GATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I 
Db 603 ATCATT GGCAT CT GT GT CT AC GT GAT CCCAGACGGAGAGACT C GCAAGAT CAAGCATCTA 662 



Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 663 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 722 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

Qy 721 TTT CCAGT GT GT GT CCTT CT GGCCT GGGT GGCAGATAAACGACT GCT CTT CT ACAAAT AC 780 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 783 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 842 

Qy 781 AT GCACAAAAAGT AC C GC AC AGACAAACAC C GAGGAATTAT CAT AGAGAC AGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 843 AT GCACAAAAAGT ACC GCAC AGACAAACAC C GAGGAAT TAT CAT AGAGAC AGAGGGTGAC 902 

Qy 841 CACCCTAAGGGCATTGAGAT GGATGGGAAAAT GATGAATT CCCATTTTCT AGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 903 CACCCTAAGGGCATTGAGAT GGATGGGAAAAT GATGAATT CCCATTTTCT AGATGGGAAC 962 

Qy 901 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGT CC CGC AGAGAGAT GAT CCGGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 963 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT CC G GAT TCT C 1022 

Qy 961 AAGGAT CT GAAGCAAAAAC ACCCAGAGAAGGACTT AGAT C AGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1023 AAGGAT CT GAAGCAAAAAC ACCCAGAGAAG GACTT AGAT C AGCT GGT GGAGAT GGC CAAT 1082 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1083 T ACT AT GCTCT TT CCC AC CAACAGAAGAGCC GT GC CTT CT AC C GTAT C CAAG C C ACTC GT 1142 

Qy 1081 AT GAT GACTGGTGCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1143 AT GAT GACTGGTGCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1202 

Qy 1141 T CCAGCAT GAG C GAGGT GC ACACC GAT GAG C CT GAGGACT TT ATTT C CAAGGT CTT CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1203 T C CAGCAT GAGC GAGGT GC ACACC GAT GAGC CT GAGGACT TT ATT T C CAAGGT CTT CT TT 1262 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1263 GACCCATGTT CTT ACCAGT GCCT GGAGAACT GT GGGGCT GTACTCCT GACAGTGGT GAGG 1322 

Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACTACAAAACAGAGGATGGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1323 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGATGGTT CTGCC 1382 

Qy 1321 AAT GC AGG GG CT GACT AT GAGT T C ACAGAGGGCAC GGT GGT T CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1383 AAT GC AGGGG CT GACT AT GAGT T C ACAGAGGGCAC G GT GGT TCT GAAGC CAGGAGAGAC C 1442 

Qy 1381 CAGAAGGAGTT CT CCGT GGGCATAATTGATGACGACATTTTT GAGGAGGATGAACACTTC 1440 

I II I I I I I I I II I II I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I II 

Db 1443 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1502 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 



1441 TT T GTAAGGT T GAGCAAT GT C C GC ATAGAGGAGGAGC AGCC AGAGGAGGGGATGC CT CC A 1500 

I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1503 T TT GTAAGGTT GAGCAAT GT CC G C ATAGAGGAGGAGCAGC C AGAGGAGGGGATG C CTC CA 1562 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I II I I II I I I I I I 
1563 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1622 

1561 GT T AC CAT CT T G GAT GAT GAC CAT GCAGGCAT CTTC ACTT T T GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1623 GT T AC CAT CT T GGAT GAT GAC CAT GCAGGCAT CTTC ACTT TT GAAT GT GAT ACT AT T CAT 1682 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I III I I I I I I II I I I I I I I I III III I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

1683 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1742 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1743 AC AGT CAT C GT C CCCT TTAGGACAGT AGAAGGGACAGC CAAG GGT GGCGGT GAGGACT T T 1802 

1741 GAAGAC AC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT GAAAAC C ATAAGGGT T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1803 GAAGACAC AT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT GAAAAC C ATAAGGGT T 1862 

1801 AAAATAGT AGAT GAGGAGGAATAC GAAAGGCAAGAGAAT TT CTT CAT TGC C CTT GGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1863 AAAATAGT AGAT GAGGAGGAATAC GAAAGGCAAGAGAAT TT CTT CAT TGCCCTTGGT GAA 1922 

1861 CC GAAAT GGAT GGAAC GT GGAAT AT C AGAT GT GACAGACAGGAAG CT GACT 1911 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1923 CC GAAAT GGAT GGAAC GT GGAAT AT C AGCGCT C CT GT TAT CTC C AGAC AGGAAGCT GACT 1982 

1912 AT GGAAGAAGAGGAGGC CAAGAGGATAGCAGAGAT GGGAAAGC CAGT AT T GG GT GAACAC 1971 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1983 AT GGAAGAAGAGGAGGC CAAGAGGATAGCAGAGAT GGGAAAGC CAGT AT T GGGT GAACAC 2042 



1972 



2043 



2032 



C C CAAACT AGAAGT CAT CAT T GAAGAGT CCT AT GAGT T CAAGACT AC GGT GGACAAACT G 2 031 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CC CAAACT AGAAGT CAT CATTGAAGAGTCCTAT GAGT TCAAGACTAC GGT GGACAAACT G 2102 



ATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATG 2 091 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2103 AT CAAGAAGACAAAC C T GGC CTT GGTT GT GGGGACC CATT CCT GGAGGGACC AGT T CAT G 2162 



2092 



2163 



2152 



2223 



2212 



2283 



GAGGC C AT C AC C GT CAGT GCAGC AGGGGAT GAG GAT GAGGAT GAAT C CGGGGAGGAGAGG 2151 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGGCCATCAC CGT CAGT GCAGCAGGGGAT GAGGAT GAGGAT GAAT C CGGGGAGGAGAGG 2222 

CTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTT 2211 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTT 2282 

GCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTC 2271 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTC 2342 



2272 AT CATT GGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCAC CATT 2331 



Db 



2343 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

ATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATT 



2402 



Qy 2332 GGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGAT 2391 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2403 GGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGAT 2462 

Qy 2392 ACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAAC 2451 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 24 63 ACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAAC 2522 

Qy 2452 GTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCC 2511 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2523 GTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCC 2582 

Qy 2512 GCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTC 2571 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I 
Db 2583 GCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTC 2642 

Qy 2572 TCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGG 2631 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2643 TCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGG 2702 

Qy 2632 CGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGG 2691 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 03 CGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGG 2762 

Qy 2692 CTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTAC 2751 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2763 CTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTAC 2822 

Qy 2752 ATCAAGGGGTTCTAA 27 66 

I I I I I I I I I I I I I I I 
Db 2823 ATCAAGGGGTTCTAA 2837 
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FEATURES Location/Qualifiers 
source 1. .5268 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/ ch r omo s ome= "14" 

/map="14q24.2" 
gene 1. .5268 

/gene="SLC8A3" 
5'UTR 1. .754 

/gene="SLC8A3" 
CDS 755. .3538 

/gene="SLC8A3" 

/note="NCX3 . 3; expressed in skeletal muscle; alternatively 

spliced" 

/ codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3 splice variant 3" 

/protein_id="AAN60791.1" 

/db_xref="GI: 24421223" 

/ trans la tion="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRA£AGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTI KKPNGETSTTTI RVWNETVSNLTLMALGS SAPEI LLSLI EVCGHGF 
I AGDLGPST I VGSAAFNMFI I IGICVYVI PDGETRKI KHLRVFFI TAAWS I FAYIWLY 
MILAVFSPGWQWEGLLTLFFFPVCVXIAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRRE1MIRILKDLKQKHPEKDLDQ 
LVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKASSMSEVHTDEPE 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGI I DDDI FEEDEHFFVRLSNVRI EEEQPEEGMPPAI FNSLPL 
P RAVLAS PCVAT VT I LDDDHAGI FT FECDT I HVS E S I GVME VKVLRT S GARGTVIVPF 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRVKIVDEEEYERQENFFIALGEPKWM 
ERGI SALLLS PDVTDRKLTMEEEEAKRI AEMGKPVLGEHPKLEVI I EES YEFKTT VDK 
LI KKTNLALWGTHSWRDQFMEAI TVSAAGDEDEDES GEERLP S CFDYVMH FLTVFWK 
VLFACVPPTEYCHGWACFAVS ILI I GMLTAI I GDLASHFGCTI GLKDSVTAWFVAFG 
T S VP DT FAS KAAALQDVYADAS I GNVTG S NAVNVFL GIG LAW S VAAI YWALQ GQE FHV 
SAGTLAFSVTLFTIFAFVCISVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYIL 
FATLEAYCYIKGF" 

3'UTR 3539. .5268 

/gene="SLC8A3" 

polyA_signal 5239. .5244 

/gene="SLC8A3" 

ORIGIN 



Query Match 98.9%; Score 2736.4; DB 9; Length 5268; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 2765; Conservative 0; Mismatches 1; Indels 18; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 755 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 814 



Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
815 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 874 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 



121 



875 



181 



935 



241 



995 



301 



ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACAGGGC AGAACAAT GAGT C CTGT T C AGGGT CAT C GGACT GCAAG GAGGGTGT C AT C CT G 934 

CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 
I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I II I I I I 
CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 994 

TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 1054 



360 



TCTATT GAAGT CAT CACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I III I I I III I I I I I I I I I I I I II I I II I 
1055 T CTATT GAAGT CAT CACCT CTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 1114 



361 



420 



AC CAGCACAAC C ACT ATT C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC CCT T ATG GC C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1115 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 1174 



421 



480 



CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1175 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1234 



481 



1235 



541 



ATT GCT GGT GAT CT GGGAC CTTCT AC CAT T GTAGGGAGT GCAG C CTT CAAC AT GTTC AT C 540 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATT GCT GGT GAT CT G GGAC CTTCT AC CAT T GTAGGGAGT GCAGC CTT CAACAT GTTC AT C 1294 



AT CAT T GGC AT CT GT GT CT ACGT GAT C C C AGACGGAGAGACT C GCAAGAT CAAGC AT CT A 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1295 AT CATT GGC AT CT GT GTCT ACGT GAT C C C AGACGGAGAGACT C G CAAGAT CAAGC AT CT A 



600 



1354 



660 



601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1355 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1414 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1415 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1474 



721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1475 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 



781 



1535 



841 



1595 



901 



1655 



ATGCACAAAAAGTAC CGCACAGACAAACACCGAGGAATT ATCATAGAGACAGAGGGT GAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCAT AGAGACAGAGGGT GAC 



780 



1534 



840 



1594 



900 



CAC CCTAAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT CC CATTTT CT AGAT GGGAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAC CCTAAG GGC ATT GAGAT GGAT GGGAAAAT GATGAATT CC CATTTT CTAGATGGGAAC 1654 

CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTGGT GCCC CT GGAAGGGAAG GAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGATT CT C 1714 



961 AAGGAT CT GAAGCAAAAAC AC C C AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGCC AAT 1020 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1715 AAGGAT CT GAAGCAAAAACAC C C AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1774 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II 
1775 TACT AT GCT CTT T C C CAC CAACAGAAGAGC C GT GCCT T CTAC CGT AT CCAAGC CACT C GT 1834 

1081 AT GATGACTGGT GCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1835 AT GAT GACT GGT GCAGGCAATATC CTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1894 

1141 T C CAG CAT GAGCGAGGT GCAC AC C GAT GAGC CT GAGGACT T TATTT C CAAGGT CT T CTTT 1200 

I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1895 T C C AGC AT GAGCGAGGT GCAC AC C GAT GAGC CT GAGGACTTT ATTT C CAAG GT CTT CTTT 1954 

1201 GAC C CAT GT T CT T ACCAGT GC CT GGAGAACT GT GGGGCT GT ACT C CT GACAGTGGT GAGG 1260 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1955 GAC C C AT GT T CTT AC C AGT GCCT GGAGAACT GT GGGGCT GT ACT CCT GACAGTGGT GAGG 2014 

1261 AAAGGGGGAGACAT GTCAAAGACCAT GTATGTGGACT ACAAAACAGAGGAT GGTTCT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
2015 AAAGGGGGAGACAT GTCAAAGACCAT GTATGTGGACT ACAAAACAGAGGAT GGTTCT GCC 2074 

1321 AAT GCAGGGGCT GACT AT GAGT T C AC AGAGGGC AC GGT GGTT CT GAAGC C AGGAGAGACC 1380 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
2075 AAT GCAGGGGCT GACTAT GAGTT CAC AGAGGGC AC GGT GGT T CT GAAGC C AGGAGAGACC 2134 

1381 C AGAAGGAGT T CT C CGT GG GC ATAAT T GAT GAC GAC ATT TT T GAGGAGGAT GAACACTT C 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2135 CAGAAGGAGT T CT C CGT GGGC AT AATTGAT GAC GAC ATT TT T GAGGAGGAT GAACACTT C 2194 

14 41 T T T GTAAG GT T GAGCAAT GT CC GC AT AGAGGAGGAGC AGC CAGAGGAGGGGAT G CCT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2195 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 2254 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2255 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2314 

1561 GT T AC CAT CTT GGAT GAT GAC CAT GC AGGCAT CTT C ACT TTT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2315 GT T AC CAT CT T GGAT GAT GAC CAT GC AGGCAT CT T C ACT TT T GAAT GT GAT ACT AT T CAT 2374 

1621 GTCAGTGAGAGTATT GGT GTTATGGAGGT CAAGGT TCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2375 GTCAGTGAGAGTATT GGT GTTATGGAGGT CAAGGT TCTGCGGACATCAGGTGCCCGGGGT 2434 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2435 ACAGTC AT C GT C CCCTT TAGGAC AGT AGAAGGGACAG C CAAGG GT GGC G GT GAG GACTTT 2494 

1741 GAAGACACAT ATGGGGAGTT GGAATT CAAGAAT GAT GAAACTGT GAAAACCATAAGGGTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2495 GAAGACACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT GAAAACCATAAGGGTT 2554 

1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CTT CATT GC C CTTGGT GAA 1860 
I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2555 AAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGAATTT CTT CATTGCCCTT GGTGAA 2614 

Qy 1861 C C GAAAT GGAT GGAACGT GGAAT AT CAGAT GT G ACAGAC AGG 1902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2615 C C GAAAT GGAT GGAAC GT GGAAT AT CAGC GCT C CT GTT AT CT CCAGAT GT GAC AGAC AGG 2674 

Qy 1903 AAG CT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGATGGGAAAGC C AGT AT T G 1962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2675 AAGCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGATGGGAAAGCCAGTATTG 2734 

Qy 1963 GGTGAACACCCCAAACTAGAAGT CAT CATTGAAGAGTCCTAT GAGTTCAAGACTACGGTG 2022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2735 GGT GAACACCCCAAACT AGAAGT CAT CATTGAAGAGT CCT AT GAGTTCAAGACTACGGTG 2794 

Qy 2023 GACAAACT GAT CAAGAAGACAAAC CT GGC CTT GGT T GT GGGGAC C C ATT CCTGGAGGGAC 2082 

I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I i I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2795 GACAAACT GAT CAAGAAGACAAAC CT GGC CT T GGT TGT GGGGACCCATT CCT GGAG GGAC 2854 

Qy 2083 CAGTT CAT GGAGGCCAT CACC GT CAGT GCAGC AGGGGAT GAGGAT GAGGAT GAAT CCGGG 2142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2855 CAGTTCATGGAGGCCATCACCGTCAGTGCAGCAGGGGATGAGGATGAGGATGAATCCGGG 2914 

Qy 2143 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 2202 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2915 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 2974 

Qy 22 03 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 2262 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2975 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 3034 

Qy 2263 TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 2322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3035 TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 3094 

Qy 2323 TGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCT 2382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3095 TGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCT 3154 

Qy 2383 GT C C CAGAT AC GT TT G CCAGCAAAGCT GCT GC C CT C CAGGAT GT AT AT GC AGACGC CT CC 2442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3155 GTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCC 3214 

Qy 2443 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 2502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3215 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 3274 

Qy 2503 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 2562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3275 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 3334 

Qy 2563 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 2622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3335 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 3394 

Qy 2623 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 2682 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3395 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 3454 



Qy 2683 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 2742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 3455 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 3514 



Qy 2743 TAT T GCT ACATCAAGGGGT T CTAA 2766 

I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3515 TAT T GCT ACATCAAGGGGT T CTAA 3538 
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Query Match 



98.8%; Score 2733.4; DB 6; Length 2781; 



Best Local Similarity 99.3%; Pred. No. 0; 

Matches 2762; Conservative 0; Mismatches 1; Indels 18; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 AC AGGGCAGAACAAT GAGT C CT GTT C AGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AC AGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT C GGACTGCAAGGAGGGT GT CAT C CT G 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT T AAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 301 T CTATTGAAGTCAT CACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 361 ACCAGCACAAC C ACT AT T C GGGT CT GGAAT GAAACT GT CT CCAACCT GAC C CT T AT GG C C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 AT T GCTGGT GAT CT GGGAC CTT CT ACC AT T GT AGGGAGT GCAGC CT T CAACAT GT T CAT C 540 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ATT GCT GGT GAT CT GGGAC CTT CT AC C ATT GT AGGGAGT GCAGCCT T CAACAT GTT CAT C 540 

Qy 541 ATCATTGGCAT CTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT CATT GGCAT CTGT GT CT AC GT GAT C C C AGAC GGAGAGACT CGCAAGAT CAAGCAT CT A 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GC ACAAAAAGTAC C GCACAGACAAACAC C GAGGAAT T ATCATAGAGAC AGAGGGT GAC 840 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGT GAC 



840 



Qy 841 CACCCTAAGGGCATTGAGATGGATGGGAAAATGATGAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I II I I I I I II 

Db 841 C AC CCTAAGGGC ATTGAGAT GGAT GGGAAAAT GATGAATT C C C ATTT T CT AGATGGGAAC 900 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 960 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 901 CTGGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGTCCCGCAGAGAGAT GATCCGGATTCT C 960 

Qy 961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGTGGAGATGGCCAAT 1020 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTT AGATCAGCT GGTGGAGATGGCCAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 T ACTAT GCT CTTT CCCAC CAACAGAAGAGC C GT GC CT T CT AC C GT AT C CAAGC CACT C GT 1080 

Qy 1081 AT GAT GACT GGT GCAGGCAATAT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACT GGT G CAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1140 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1141 T CC AGCAT GAG C GAGGT GCACAC CGAT GAGC CT GAGGACTT T AT TT C CAAGGT CTT CT T T 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I 
Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGGGGGAGACATGT CAAAGACCAT GTAT GT GGACTACAAAACAGAGGAT GGTTCT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 AAAGGGGGAGACATGT CAAAGACCAT GTAT GT GGACTACAAAACAGAGGAT GGTTCT GCC 1320 

Qy 1321 AAT GC AGGGGCT GACT AT GAGT T CACAGAGGGC ACGGT G GT T CT GAAGC CAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GC AGGGGCTGACTAT GAGT T CACAGAGGGC AC GGT G GT T CT GAAGC CAGGAGAGAC C 1380 

Qy 1381 CAGAAGGAGT T CTCCGT G GGCAT AAT T GAT GAC GAC AT T TT T GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1381 CAGAAGGAGT T CTCCGT GGGCAT AAT T GAT GAC GAC AT T T T T GAGGAGGAT GAACACTT C 1440 

Qy 1441 T TT GTAAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGC AG C C AGAGGAG GGGATGC CT C C A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T TT GTAAGGT T GAGCAAT GT C C GC AT AGAGGAGGAGCAG C C AGAGGAGGGGAT GC CT C CA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT CTTGGATGAT GAC CAT GC AGGCATCTT CACT TT T GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1561 GTT ACC AT CT T GGAT GAT GAC CAT G C AGGCAT CTT CACT TT T GAAT GT GAT ACTATT CAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 



1681 ACAGT CATCGT CC C CTTT AGGAC AGT AGAAGG GACAGC CAAGGGT GGCGGT GAGGACTT T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I 
1681 ACAGT CATCGT C CC CT TT AGGAC AGT AGAAG GGACAGCCAAGGGT GGCGGT GAGGACTT T 1740 

1741 GAAGACACAT AT GGGGAGT T G GAAT T CAAGAAT GAT GAAACT GT GAAAAC C AT AAG GGT T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GAAGACACAT AT GGGGAGT T G GAAT T CAAGAAT GAT GAAACT GT GAAAAC C AT AAGGGT T 1800 

1801 AAAATAGTAGAT GAGGAGGAAT AC GAAAG GCAAGAGAATTT CTT C ATT GC C CT T GGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1801 AAAATAGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGAATTT CT T CAT TGCCCTTGGT GAA 1860 

1861 C C GAAATGGAT GGAAC GT GGAAT AT C AGAT GT GAC AGACAGG 1902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1861 C C GAAATGGAT GGAAC GT GGAAT ATCAGGTGT GAGATTCTTTAAAGATGTGACAGACAGG 1920 

1903 AAGCTGACTAT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGATGGGAAAGC C AGT AT T G 1962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I 
1921 AAGCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGCAGAGAT GG GAAAGC CAGT AT T G 1980 

1963 GGTGAACACCCCAAACTAGAAGT CAT CATTGAAGAGTCCTATGAGTTCAAGACTACGGT G 2022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1981 GGT GAACACCCCAAACTAGAAGT CAT CATTGAAGAGTCCTAT GAGTT CAAGACTACGGT G 204 0 

2023 GACAAACTGAT CAAGAAGACAAAC CT GGC CT T GGTT GT GGGGAC C CAT T C CT GGAGGGAC 2082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 GACAAACT GAT CAAGAAGACAAACCT GGC CT T G GTT GT GGGGAC CC AT T C C T G GAGGGAC 2100 

2083 CAGTTCATGGAGGC CAT CACCGT CAGT GCAGCAGGGGATGAGGATGAGGAT GAATCCGGG 2142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I 
2101 CAGT T C AT GGAGGC CAT C AC C GT CAGT GC AGCAG GGGAT GAGGAT GAGGAT GAAT C C GGG 2160 

2143 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 2202 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 2220 

2203 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 2262 

I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
2221 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 2280 



2263 



2322 



TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I 
2281 TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 2340 

2323 TGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCT 2382 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 TGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCT 24 00 



2383 



2442 



GTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCC 
M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2401 GTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCC 24 60 

2443 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 2502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 2520 



Qy 

Db 



2503 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 2562 

I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I II I I I I I I I 
2521 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 2580 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



2563 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 2622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2581 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 2640 

2623 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 2682 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I 

264 1 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 2700 

2683 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 2742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I t I I I I I I I || I I I I I I I 

2701 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 2760 



2743 



2763 



TATTGCTACATCAAGGGGTTC 
I I I I I I I I I I I I I I I I I I I I I 
2761 TATTGCTACATCAAGGGGTTC 2781 
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splice form A (SCL8A3 gene) . 
AJ304852 
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2 (bases 1 to 2840) 
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Location/Qualifiers 

1. .2840 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/chromosome="14" 

/map="14q24.1" 

1. .2840 

/gene="SCL8A3" 

63. .2840 

/gene="SCL8A3" 

/function=" sodium/ calcium exchanger" 



/note="alternative splice form A, (exons 2, 3, 5, 9, 10, 

11, 12)" 

/ codon_start=l 

/product="sodium/calcium exchanger SCL8A3" 

/protein_id="CAC40984.1" 

/db_xref="GI : 14330383" 

/ db_x r e f = " GO A : Q 9 6QG2 " 

/ db_xref ="SPTREMBL : Q96QG2 " 

/ trans la tion="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREWIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
I AGDLGPSTI VGSAAFNMFI 1 1 GI CVYVI PDGETRKI KHLRVFFI TAAWS I FAYI WLY 
MILAVFSPGWQWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKASSMSEVHTDEPE 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAIFNSLPL 
P RAVLAS P C VAT VT I LD D DHAG I FT FEC DT I HVS ESI GVMEVKVL RT S GARGTVI VP F 
RTVEGTAKGGGEDFEDTYGELEFKNDETVKTIHIKVIDDEAYEKNKNYFIEMMGPRMV 
DMSFQKALLLSPDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKTTVDKLI 
KKTNLALWGTHSWRDQFMEAITVSAAGDEDEDESGEERLPSCFDYVMHFLTVFWKVL 
FACVP PTEYCHGWACFAVS I LI I GMLTAI I GDLASHFGCT I GLKDSVTAWFVAFGT S 
VP DT FAS KAAALQ D VYADAS I GNVT G S N AVNVFLG I GLAW S VAAI YWALQ GQ E FHVS A 
GTLAFSVTLFTI FAFVCI SVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYI LFA 
TLEAYCYI KGF" 



ORIGIN 



Query Match 96.1%; Score 2657.6; DB 9; Length 2840; 

Best Local Similarity 97.6%; Pred. No. 0; 

Matches 2712; Conservative 0; Mismatches 54; Indels 12; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 63 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 122 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 123 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 182 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 183 ACAGGGCAGAACAAT GAGTCCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GTCAT CCT G 242 

Qy 181 CCAAT CT GGTAC CC GGAGAAC C CT T C C CT T GGGGAC AAGAT T GC CAGGGT C ATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 243 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 302 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 303 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 362 

Qy 301 T CT AT T GAAGT CAT CAC CT CT CAAGAGAG GGAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 363 T CTATTGAAGT CAT CACCTCTCAAGAGAGGGAGGT GACAATTAAGAAAC CCAAT GGAGAA 422 



Qy 



361 



ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



423 ACCAG CACAAC C ACT AT T C GGGT CT GGAAT GAAACT GT CT C CAACCT GACCCT T AT GG CC 482 



Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 4 83 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 543 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 602 

Qy 541 ATCATT GGCATCT GTGT CT ACGTGATCCCAGACGGAGAGACT CGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 603 ATCATTGGCATCTGTGT CT ACGT GATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 662 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I 
Db 663 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 722 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 83 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 842 

Qy 781 AT GC ACAAAAAGT ACC G CAC AGACAAACAC C GAGGAAT TAT CAT AGAGACAGAGGGTGAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 843 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCAT AGAGACAGAGGGTGAC 902 

Qy 8 41 CACCCTAAGGGCATTGAGAT GGAT GGGAAAATGAT GAATT CCCATTTT CTAGATGGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 903 CACCCTAAGGGCATTGAGAT GGAT GGGAAAATGAT GAATT CCCATTTT CTAGATGGGAAC 962 

Qy 901 CTGGTGCCCCTGGAAGGGAAGGAAGTGGAT GAGT CCCGCAGAGAGAT GAT CCGGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 963 CT GGT GC CCCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGAT T CT C 1022 

Qy 961 AAGGAT CT GAAGCAAAAAC ACC CAGAGAAG GACTTAGAT C AGCT GGT GGAGAT GG C CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1023 AAGGAT CT GAAG CAAAAACACCC AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC C AAT 1082 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1083 TACT AT GCT CT T T C CCAC CAAC AGAAGAGC C GT GC CT T CT ACC GT AT C CAAGC CACT C GT 1142 

Qy 1081 AT GAT GACT GGT GC AGG CAAT AT C CT GAAGAAAC AT GC AG CAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1143 AT GAT GACTGGT GCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGC CAAGAAGGC C 1202 

Qy 1141 T C CAGC AT GAGC GAGGT GC ACACC GAT GAG C CT GAGGACTT T AT T T C CAAGGT CTT CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1203 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1262 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1263 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1322 



Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1261 AAAGGGGGAGAC AT GTCAAAGACCAT GT AT GT GGACTACAAAACAGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1323 AAAGGGGGAGAC AT GTCAAAGACCAT GT AT GT GGACTACAAAACAGAGGAT GGT T CT GCC 1382 

1321 AAT GCAGGGGCTGACTAT GAGTT CACAGAGGGCACGGTGGTT CTGAAGCCAGGAGAGACC 1380 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

1383 AAT GC AGGGGCT GACT AT GAGT T CACAGAGGGCAC GGT GGT T CT GAAGC CAGGAGAGAC C 1442 

1381 CAGAAGGAGTTCT CCGTGGGCATAATTGAT GACGACATTTTT GAGGAGGATGAACACTTC 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1443 CAGAAG GAGT T CT CC GT GGGCAT AAT T GAT GAC GAC AT TT T T GAGGAGGAT GAACACT T C 1502 

1441 T T T GTAAGGTTGAGCAAT GT C C GCATAGAGGAGGAGCAGC C AGAGGAGGGGAT GC CT C CA 1500 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1503 T T T GTAAGGTTGAGCAAT GT C C GCAT AGAGGAGGAGCAGC C AGAGGAGGGGAT GC CT C CA 1562 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1563 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1622 

1561 GTTACCATCTTGGAT GATGACCATGCAGGCATCTT CACTTTTGAAT GT GAT ACT ATT CAT 1620 

I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I 
1623 GT T AC CAT CT T GGAT GAT GAC CAT GCAGGC ATCT T CACTT T T GAAT GT GAT ACT AT T CAT 1682 

1621 GT C AGT GAGAGT ATT GGT GT TAT GGAGGT CAAG GT T CT GC GGACAT C AGGT GC C C GG GGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1683 GT C AGT GAGAGT ATT GGT GT TAT GGAGGT CAAG GT T CT GC GGACAT CAGGT GC CC GGGGT 1742 

1681 AC AGT CAT C GT C C C CTT T AGGAC AGT AGAAGGGAC AGC CAAGGGT GGCGGT GAGGACT TT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
174 3 AC AGT CAT C GTC C C CTT T AGGAC AGT AGAAGGGAC AGC CAAGGGT GG CGGT GAGGACTTT 1802 

1741 GAAGAC AC AT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT GAAAAC C ATAAGGGT T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I 

1803 GAAGAC ACAT AT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT CAAAACAATT C AC AT C 1862 

1801 AAAATAGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAATT T CTT CAT T GC CCTT G GT GAA 1860 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1863 AAGGTAAT T GAT GAT GAGGCAT AT GAGAAAAACAAGAATT ACTT C AT T GAGAT GAT GGGC 1922 

1861 C C GAAAT GGAT GGAAC GT GGAAT AT CAGAT GT G AC AGACAGGAAG CT G 1908 

II I I I I I II III I I I I I I I I I I I I I I 

1923 C C C C GCAT GGT GGAT AT GAGT T T T C AGAAAGCGCT C CT GT T ATCT C CAGAC AGGAAGCT G 1982 

1909 ACT AT GGAAGAAGAGGAGGC CAAGAGGATAGCAGAGAT GG GAAAGC CAGT ATTGGGT GAA 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1983 ACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGAT GGGAAAGC CAGT ATT GGGTGAA 2042 

1969 CACCCCAAACTAGAAGT CAT CATTGAAGAGT CCT AT GAGTT CAAGACTACGGT GGACAAA 2028 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
2043 CAC CCCAAACTAGAAGT CATCATT GAAGAGT CCT AT GAGTTCAAGACTACGGTGGACAAA 2102 

2029 CTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTC 2088 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2103 CTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTC 2162 



Qy 

Db 



2089 ATGGAGGCCATCACCGTCAGTGCAGCAGGGGATGAGGATGAGGATGAATCCGGGGAGGAG 214 8 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2163 AT GGAGGCCAT CAC CGT CAGT GCAGCAGGGGATGAGGAT GAGGAT GAAT C CGGG GAGGAG 2222 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2149 AGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTG 2208 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
2223 AGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTG 2282 

2209 TTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATC 2268 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2283 TTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATC 2342 

2269 CTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACC 2328 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III tilt I I I I I I 
2343 CTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACC 2402 

2329 AT TGGT CT CAAAGATT CAGT CACAGCT GT T GT TTT C GT GGCATT TGGC AC CT CT GT CC C A 2388 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2403 ATTG GT CT CAAAGATT CAGT CACAGCT GT T GT TT T CGT GGCAT T TGGCAC CT CT GT C C C A 2462 

2389 GAT AC GT TT GC CAGCAAAGCT GCT GC CCT C C AGGAT GT AT AT GCAGAC GC CT C C ATT GGC 2448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

24 63 GAT AC GT T T GC CAGCAAAGCT GCT GC C CT C C AGGAT GT AT AT GCAGAC GC CT C CAT TGGC 2522 

2449 AACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTG 2508 
I I I I I I I I I I I I I I I I I I I I I I I I I II I II II I I I I I I I I I I I I I II II I I I I I I I I I I I 
AACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTG 2582 



2523 



2509 



2583 



2569 



2643 



2629 



GCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCC 2568 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCC 2642 

TTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGA 2628 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGA 2702 



AGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACA 2688 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I II I I I I I I I 
2703 AGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACA 2762 

2689 TGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGC 2748 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
27 63 TGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGC 2822 

2749 TACATCAAGGGGTTCTAA 2766 

I I I I I I I I I I I I I I I I I I 
2823 TACATCAAGGGGTTCTAA 2840 
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ACCESSION 
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KEYWORDS 



AF510503 5146 bp mRNA 

Homo sapiens Na+/Ca2+ exchanger isoform 3 
mRNA, complete cds; alternatively spliced, 
AF510503 

AF510503. 1 GI:24421224 



linear PRI 30-OCT-2002 
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3'UTR 
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Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 5146) 

Gabellini,N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 

The human SLC8A3 gene and the tissue-specific Na(+)/Ca(2+) 

exchanger 3 isoforms 

Gene 298 (1), 1-7 (2002) 

22294016 

12406570 

2 (bases 1 to 5146) 

Gabellini, N. , Bortoluzzi, S . , Danieli,G.A. and Carafoli,E. 
Direct Submission 

Submitted ( 09-MAY-2002 ) Department of Biology, Unv. of Padova, via 
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Location/Qualifiers 

1. .5146 

/organism="Homo sapiens " 
/molJ:ype="mRNA" 
/db_xref="taxon: 9606" 
/ ch r omo s ome= "14" 
/map="14q24.2" 
1. .5146 
/gene="SLC8A3" 
1. .754 

/gene="SLC8A3" 
755. .2617 
/gene="SLC8A3" 

/note="NCX3 . 4 ; expressed in skeletal muscle; alternatively 

spliced" 

/codon_start=l 

/product="Na+/Ca2+ exchanger isoform 3 splice variant 4" 
/protein_id="AAN607 92 . 1" 
/db_xref="GI: 24421225" 

/ trans la tion="MAWLRLQPLTSAFLHFGLVTFVLFLNGLRAEAGGSGDVPSTGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
I AGDLGPSTI VGSAAFNMFI 1 1 GI CVYVI PDGETRKI KHLRVFFI TAAWS I FAYIWLY 
MII^VFSPGWQWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNLVPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMAN Y YAL S HQQKS RAFYRI QAT RMMT GAGN I LKKHAAEQAKKAS SMS EVHT DE P E 
DFISKVFFDPCSYQCLENCGAVLLTWRKGGDMSKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRIEEEQPEEGMPPAIFNSLPL 
PRAVLAS PCVATVT I LDDDHAGI FT FECDT I HVS ES I GVMEVKVLRT SGARGTVI VPF 
RTVEGTAKGGGEDFEDTYGELEFKNDETVCDRQEADYGRRGGQEDSRDGKASIG" 
2618. .5146 
/gene="SLC8A3" 
ignal 5117. .5122 

/gene="SLC8A3" 



Query Match 92.1%; Score 2546.4; DB 9; Length 5146; 

Best Local Similarity 96.2%; Pred. No. 0; 

Matches 2661; Conservative 0; Mismatches 1; Indels 104; Gaps 1; 



Qy 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 755 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 814 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 815 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 874 

Qy 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 875 ACAGGGC AGAACAAT GAGT C CT GTT CAGGGT C AT C GGACT GCAAGGAGGGTGT CAT CCT G 934 

Qy 181 C CAAT CT GGT AC C C GGAGAACCCT T CCCTT GGGGACAAGAT T GC CAGGGT CATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 935 C CAAT CT GGT AC C C GGAGAACC CT T C CCTT GGGGACAAGATT GC CAG GGT CATT GT CTAT 994 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 995 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 1054 

Qy 301 TCTATT GAAGT CATCACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1055 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 1114 

Qy 361 AC CAGCACAAC C AC TAT T C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC CCT TAT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1115 AC CAGCACAAC C ACTATT C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC CCT TAT GGC C 1174 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1175 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1234 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1235 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 1294 

Qy 541 ATCATTGGCATCT GTGT CT ACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1295 AT CAT T GGCAT CT GTGT CT ACGT GAT CCCAGACGGAGAGACT C GCAAGAT CAAGCATCTA 1354 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1355 C GAGT CT T CT T CAT CAC CGCTGCTT GGAGT AT CTT T G CCT AC AT CT GGCTCT AT AT GAT T 1414 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1415 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1474 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1475 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1534 

Qy 781 AT GCACAAAAAGT ACC GCAC AGACAAACAC CGAGGAAT TAT C AT AGAGAC AGAG GGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1535 AT GCAC AAAAAGT ACC GCAC AGACAAACAC CGAGGAAT TAT CAT AGAGAC AGAGGGT GAC 1594 

Qy 841 CACCCTAAGGGCATTGAGAT GGATGGGAAAAT GAT GAATT CCCATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1595 C AC C CTAAGGGC ATT GAGAT GGAT GG GAAAAT GAT GAAT T CC CATTTT CTAGAT GGGAAC 1654 

Qy 901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGTC CCGCAGAGAGAT GAT C CGGATT CT C 960 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1655 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 1714 

Qy 961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1715 AAGGAT CT GAAG CAAAAAC AC C CAGAGAAGGACTTAGAT CAG CT GGT GGAGAT GGCCAAT 1774 

Qy 1021 TACT AT GCT CT TT CC C AC CAACAGAAGAGC C GC GC CT T CT AC C GT AT C C AAGC C ACT C GT 1080 

I I II I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1775 TACT AT GCT CT T T C C C AC CAACAGAAGAGC C GT GC CT T CTAC CGT AT CCAAGC C ACT C GT 1834 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAGG CC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1835 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1894 

Qy 1141 T C CAG CAT GAGC GAGGT GCACAC C GAT GAGCCT GAGGACT TT AT T T C C AAGGT CTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1895 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1954 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1955 GAC C CATGT T CT T AC CAGT GC CT GGAGAACT GT GGGGCT GT ACT C CT GACAGT GGT GAGG 2014 

Qy 1261 AAAGG GGGAGAC AT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2015 AAAG G GGGAGAC AT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 2 074 

Qy 1321 AAT GC AGGGGCT GACT AT GAGTT C ACAGAGGGCAC GGT GGTT CT GAAGCCAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I 

Db 2075 AAT GC AGGGGCT GACT AT GAGTT C ACAGAG GGCAC GGT GGTT CT GAAGCCAGGAGAGAC C 2134 

Qy 1381 CAGAAGGAGTT CT CCGTGGGCATAATT GATGACGACATTTTT GAGGAGGATGAACACTTC 144 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2135 CAGAAGGAGTT CT CCGTGGGCATAATT GATGACGACATTTTT GAGGAGGATGAACACTTC 2194 

Qy 1441 TT T GTAAGGTT GAGCAAT GT C C GCATAGAGGAGGAGCAGC CAGAGGAGGGGAT G C CT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2195 TTTGTAAGGTT GAGCAAT GT CCGCAT AGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 2254 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 
Db 2255 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2314 

Qy 1561 GTTAC CAT CTT GGAT GAT GACCAT GCAGGCATCTT CACTTTT GAAT GTGAT ACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2315 GTTAC CATCTTGGAT GAT GACCAT GCAGGCAT CTT CACTTTTGAAT GTGAT ACTATT CAT 2374 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2375 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2434 

Qy 1681 ACAGT CAT CGT CCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGT GGCGGTGAGGACTTT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2435 ACAGT CAT CGTCCCCTT T AGGACAGT AGAAGG GAC AG C CAAGGGT GGCGGT GAGGACTT T 2494 



Qy 1741 GAAGACACATATGGGGAGTTGGAATTCAAGAATGATGAAACT GT GAAAACCATAAGGGTT 1800 

I I I I I I I I I I I I t I II I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 24 95 GAAGAC ACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT 2538 

Qy 1801 AAAATAGTAGAT GAGGAGGAATACGAAAGGCAAGAGAATTT CTTCATTGCCCTTGGT GAA 1860 

Db 2539 2538 

Qy 1861 CCGAAAT GGAT GGAACGTGGAATATCAGAT GTGACAGACAGGAAGCTGACTATGGAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2539 AT GT GACAGACAGGAAGCT GACTATGGAAGAA 2570 

Qy 1921 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGCCAGTATT GGGT GAAC AC C C CAAACT A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2571 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGCCAGTATT GGGT GAACACCC CAAACT A 2630 

Qy 1981 GAAGTCAT CATT GAAGAGTCCT AT GAGTTCAAGACTACGGTGGACAAACT GAT CAAGAAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2631 GAAGT CAT CATT GAAGAGT C CT AT GAGT T CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2690 

Qy 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2691 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2750 

Qy 2101 ACCGT CAGT GCAGCAGGGGAT GAGGAT GAGGAT GAAT C C GGGGAGGAGAGGCT GC C CT C C 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2751 AC C GT CAGT GC AGCAGG G GAT GAGGAT GAG GAT GAAT C C GGGGAGGAGAGG CT GC C CT CC 2810 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2811 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2870 

Qy 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2871 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2930 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2931 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2990 

Qy 2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2991 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 3050 

Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3051 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 3110 

Qy 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3111 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 3170 

Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3171 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 3230 



Qy 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 264 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 
Db 3231 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 3290 



Qy 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3291 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 3350 

Qy 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 3351 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 3410 

Qy 2761 TTCTAA 2766 

I I I I I I 

Db 3411 TTCTAA 3416 
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Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: Plate: Row: Column: 0. 

Location/Qualifiers 

1. .4640 

/organism= fl Mus musculus 11 
/mol_type="mRNA" 
/strain="C57BL/6" 
/db_xref="taxon: 10090" 
/clone="MGC: 63358 IMAGE : 6837128 " 

/tissue_type="Brain, enriched mouse brain 12.5dpc" 

/clone_lib="NIH_BMAP_FIO" 

/lab_host="DH10B" 

/note="Vector: pYX-ASC" 

1. .4640 

/gene="Slc8a3" 

/note="synonym: Ncx3" 

/db_xref="LocusID: 110893" 

/db_xref="MGI: 107976" 

373. .3138 

/codon_start=l 

/product="Slc8a3 protein" 

/protein_id="AAH52435. 1" 

/db_xref="GI : 30851385" 

/db_xref="LocusID: 110893" 

/ trans la tion="MAWLRLQPLTSAFLHFGLVTFVLFLNCLRAEAGDSGDVPSAGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTIKKPNGETSTTTIRVWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPSTI VGSAAFNMFI 1 1 GI CVYVI PDGETRKI KHLRVFFVTAAWS I FAYI WLY 
MILAVFSPGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNFTPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LV^MANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKTSSMSEVHTDEPE 
DFASKVFFDPCSYQCLENCGAVLLTWRKGGDISKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRVEEEQLAEGMLPAILNSLPL 
. P RAVLAS P C VAT VT I LD D DHAG IFTFECDTI H VS ESI G VME VKVL RT S GARGT VI VP F 
RTVEGTAKGGGEDFEDAYGELEFKNDETVKT I RVKI VDEEEYERQENFFIALGEPKWM 
ERGISEVTDRKLTVEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKSTVDKLIKKTN 
LALWGTHSWRDQFMEAITVSAGGDEDEDESGEERLPSCFDYVMHFLTVFWKVLFACV 
PPTEYCHGWACFWS I LI I GMLTAI I GDLASHFGCTI GLKDSVTAWFVAFGTSVPDT 



misc feature 



misc feature 



misc feature 



misc feature 



FAS KAAALQ DVYADAS I GNVT G SNAVNVFLG I GLAW S VAAI YWAMQGQ E FHVS AGT LA 
FSVTLFTIFAFVCLSVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYILFATLEA 
YCYIKGF" 
706. .1143 

/note="Na_Ca_Ex; Region: Sodium/ calcium exchanger protein. 
This is a family of sodium/ calcium exchanger integral 
membrane proteins. This family covers the integral 
membrane regions of the proteins. Sodium/ calcium 
exchangers regulate intracellular Ca2+ concentrations in 
many cells" 

/db_xref="CDD:pfam01699" 
1534. .1827 

/note="Calx-beta; Region: 
/ db_xre f = " CDD : p f amO 3 160" 
1927. .2229 

/note="Calx-beta; Region: 
/db_xref="CDD:pfam03160" 
2641. .3087 

/note="Na_Ca_Ex; Region: Sodium/ calcium exchanger protein. 
This is a family of sodium/ calcium exchanger integral 
membrane proteins. This family covers the integral 
membrane regions of the proteins. Sodium/ calcium 
exchangers regulate intracellular Ca2 + concentrations in 
many cells" 

/db_xref="CDD:pfam01699" 



Calx-beta domain" 



Calx-beta domain" 



ORIGIN 



Query Match 86.7%; 
Best Local Similarity 91.7%; 
Matches 2536; Conservative 



Score 2398; DB 10; 
Pred. No. 0; 
0; Mismatches 230; Indels 



Length 4640; 

0; 



Gaps 



0; 



Qy 

Db 



373 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
ATGGCGTGGTTACGGCTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACT 432 



Qy 

Db 

Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I II 
433 TTTGTGCTCTTCCTGAATTGTCTTCGAGCAGAGGCTGGTGACTCGGGGGATGTGCCCAGT 492 

121 ACAGGGCAGAACAAT GAGT CCT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II 
493 GCAGGGCAGAACAATGAGTCCTGTTCGGGGTCATCAGACT GCAAGGAGGGT GTCATTTTG 552 



Qy 

Db 

Qy 

Db 

Qy 

Db 



181 C CAAT CT GGT AC C C GGAGAAC C CTT C C CTT GGGGACAAGATT GC CAGGGT CAT T GT CT AT 240 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
553 C CAAT CT GGT AT C C AGAGAAC C CTT C C CTT GGGGACAAGATT GCCAGGGT CAT T GT CT AT 612 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
613 TTTGTGGCCCT GAT AT ACAT GTTTCTTGGGGTGTC TAT CAT T GCT GAC C GAT T C AT GGC A 672 

301 T CT ATT GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
673 T CTAT TGAAGT CAT T ACT T CC C AAGAGAGGGAAGT GAC CAT CAAGAAGCC CAAT GGAGAG 732 



Qy 



361 



AC CAGCACAAC C ACT AT T CGGGT CT GGAAT GAAAC T GTCTCCAACCT GAC C CT T AT G GC C 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



420 



Db 733 ACCAGC ACAACTACAATT C GGGT AT GGAAT GAAACT GT CT C CAAT CT GAC C CT GAT GGCC 792 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Mill II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 793 CTGGGCTCTTCTGCTCCAGAGATTCTCCTGTCTTTAATTGAGGTGTGTGGTCACGGGTTC 852 

Qy 481 AT T GCT GGT GAT CT GGGACCTT CT AC CATT GT AG GGAGT GCAGC CT T CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I I 

Db 853 ATTGCTGGTGATCTGGGACCATCTACCATCGTTGGCAGTGCAGCCTTCAACATGTTCATC 912 

Qy 541 ATCATT GGCATCT GT GTCTACGT GAT CCCAGACGGAGAGACT CGCAAGATCAAGCAT CTA 600 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 

Db 913 AT CATT GGCAT CT GT GT CT AT GT GAT CC CAGAT GGGGAGACT CGAAAGAT CAAGCAC CTG 972 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I MM I I II I I M I I I II I I I II M I II I I I I II I I I II I I I I 

Db 973 CGAGTCTTCTTCGTCACGGCTGCTTGGAGCATCTTCGCCTACATTTGGCTCTATATGATC 1032 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I II I I I I II II M I II I II I II I I I I I I I I I II II II M II II I I II I I I I II I II I 

Db 1033 CTGGCAGTCTTCTCTCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTTACTCTCTTCTTC 1092 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I II I I I I II I I I I I II I I I II I I I I I I II I I I I I I II II I I I II I I I I I I I I I I 

Db 1093 TTTCCCGTGTGTGTCCTGCTGGCTTGGGTGGCAGATAAGCGACTGCTCTTCTACAAATAC 1152 

Qy 781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGT GAC 840 

I I I I I I I II I I I I I I I I I II I I II I I II I I II II I I I I I II I I II II I I I I II I I I I 

Db 1153 AT GCACAAAAAAT AC CGCAC AGAT AAAC AC C GAGGAATTAT CAT T GAGACAGAGGGT GAC 1212 

Qy 841 CAC C CT AAGGGC AT T GAGAT GGAT GGGAAAAT GAT GAATT C C CATT TT CT AGAT GGGAAC 900 

I I I I I I I II I II I I I I I I II I I I II I I I I I I I I I I I II I I I II I I I II I I II II I I I I 

Db 1213 CAC C CT AAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATT CT C ACT TTCT AGAT GGGAAC 1272 

Qy 901 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT CC C GCAGAGAGAT GAT C C GGATT CT C 960 

I II I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1273 T TT AC AC CT T T GGAAGGAAAGGAGGT AGAT GAAT CT CGCAGG GAAAT GAT C C GGAT T CTA 1332 

Qy 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

I I I II I I I I I I II II I II I I I II I I I I I I I I II I II II I I I I I I I I I I I I I I I II I I 

Db 1333 AAG GAT CT GAAACAAAAACACCC AGAAAAGGAC CT AGAT C AG CT GGT GGAGAT G GC CAAT 1392 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I II I I I II 

Db 1393 TACTATGCTCTTTCCCATCAACAGAAGAGCCGTGCTTTCTACCGCATCCAAGCCACCCGG 1452 

Qy 1081 ATGATGACT GGTGCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I II I I I I I II Mill II I I I I II II II I II II I I I I I II 

Db 1453 AT GAT GACT GGT GC GGGCAAT AT ACT TAAGAAGCAT GCAG C C GAGCAAGCCAAGAAGACC 1512 

Qy 1141 T C C AGC AT GAGC GAGGT GCACAC C GATGAGC CT GAGGACT T TAT T T C CAAG GT CT T CTTT 1200 

II I II II II I II II I II II I I II I I I II II I II II II I II M I I I II II II II I 

Db 1513 TCCAGCATGAGCGAGGTGCATACCGATGAGCCGGAGGACTTTGCCTCTAAGGTCTTCTTT 1572 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

II II I I II I I I I I I I I II I II II I I I I I I II II I I I II I I I II II I I II If M II I 

Db 1573 GAC C CAT GT T CT T AT CAGT GC CT G GAGAACT GT GGAGCT GT C CT CCT GAC C GT GGT GAGG 1632 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1261 AAAGGGGGAGACAT GT CAAAGAC C ATGTAT GT G GACT ACAAAAC AGAGGATG GT T CTGC C 1320 
I I I I I I I I I I I II II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II II III 
AAAGGGGGAGAT AT AT C CAAGAC CAT GTACGT GGACT ACAAAAC AGAGGACGGCT CCGCC 



1633 



1692 



1321 AATG CAGGGGCT GACTAT GAGT T C ACAGAGGGCAC GGT GGT T CT GAAGC C AGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

1693 AATGCAGGGGCAGACTATGAGTTCACAGAGGGCACT GT GGTTCTGAAGCC AGGAGAGACC 1752 

1381 CAGAAG GAGTT CT C CGT GG GCATAAT T GAT GAC GACAT TT TT GAGGAGGATGAACACT T C 1440 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1753 C AGAAGGAGTT CT CT GT GGGCAT C ATT GAT GATGAC ATTT TT GAGGAGGATGAACACT T C 1812 

1441 TT TGTAAGGTT GAGCAAT GT CC GC AT AGAGGAGGAGC AGCCAGAGGAGGGGAT GC CTCCA 1500 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

1813 T T TGT GAGGCT GAGCAAT GT CC GT GT AGAAGAGGAGC AGCT G GC GGAGGGGAT GCT C C CA 1872 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1873 GCAATACTCAATAGTCTTCCTTTGCCTCGGGCTGTCCTGGCCTCCCCTTGTGTGGCCACA 1932 

1561 GTT AC CAT CTT GGATGAT GAC CAT GC AGGC AT CT T CACTTTT GAAT GT GATACT AT TC AT 1620 

II I I I I I I I I I I I I I I I II I I I I I I I II II I I I I II I I I I I I I I I I I I I I II I I I I 
1933 GTAACCAT CTT GGATGAT GACCATGCAGGAATTTT CACTTTT GAATGTGATACCATTCAT 1992 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

1993 GT CAGT GAAAGT ATT GGT GT TAT GGAAGT CAAGGT TTT GAGGAC AT CAGGTG CCAGGGGC 2052 



1681 ACAGT CAT CGT C C C CT T TAGGACAGT AGAAGG GACAGC CAAGGGT GGC GGT GAG GACT TT 174 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I I I I I I I 
ACAGT CAT CGT C C CTT T TAGGACAGT AGAAGG GACAGC CAAGGGT GGT GGCGAGGACT TT 2112 



2053 



17 41 GAAGAC ACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GT GAAAAC CATAAGGGTT 1800 

I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2113 GAAGATGCATAT GGGGAGCT GGAGTT CAAGAAT GAT GAAACAGT GAAAAC CATAAGGGTT 2172 

1801 AAAAT AGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGAATTT CT T CATT GC CCT T GGTGAA 1860 

I I I I I II I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2173 AAAAT AGTAGAT GAGGAGGAGTACGAGAGGCAAGAGAATTTCTTCATT GCCCTT GGTGAA 2232 

1861 C C GAAAT GGAT GGAACGT GGAAT AT CAGAT GT GAC AGAC AGGAAGCT GACT AT GGAAGAA 1920 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
2233 C C GAAAT GGAT GGAACGT GGAAT AT CAGAAGT GAC AGAC AGGAAGCT GAC TGT G GAGGAA 2292 

1921 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC C AGT AT T GGGT GAAC ACC C CAAACT A 1980 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2293 GAGGAAGCCAAGAGAAT AGCAGAGAT GGGAAAGC CAGTAT T GGGT GAAC ACC C CAAACT A 2352 

1981 GAAGT CAT CATT GAAGAGT C CT AT GAGT T CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2040 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I II I I I I I I I II I I I 
2353 GAGGT C AT CATT GAAGAGT C CT AT GAGT T CAAGAGT ACAGT GGAT AAGCT GAT CAAGAAG 2412 

2041 ACAAAC CT GGCCT T GGT T GT GGG GAC C CAT T C CT GGAGGGAC CAGTT CAT GGAGGCCAT C 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2413 ACAAAC CT GGCAT T G GT T GT GGGGAC CCAT T C CT GGAGGGAC CAGTT CAT GGAAGCCAT C 2472 



Qy 2101 
Db 2473 



ACCGTCAGT GCAGCAGGGGATGAGGAT GAGGAT GAATCCGGGGAGGAGAGGCTGCCCT CC 2160 
II II I I I I I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I III 
ACTGTT AGT GCAGGAGGGGATGAGGATGAAGACGAATCTGGAGAGGAGAGGCTGCCAT CC 2532 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2533 TGCTTTGACTACGTCATGCACTTCCTGACGGTCTTCTGGAAGGTGCTCTTTGCCTGTGTG 2592 

2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2593 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGTGGTCTCCATCCTCATTATTGGC 2652 

2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 II mill 1 1 it n in ii 1 1 ii i it n in ii Mm 

2653 ATGCTCACCGCCATCATCGGGGACCTGGCCTCTCACTTCGGCTGCACCATCGGGCTCAAG 2712 

2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

Mill I I I I I I I I II I II I I I I I I I II I M I I I I I M I I I I I I I I II II I I I I II 
2713 GATTCGGTCACAGCTGTTGTTTTTGTGGCATTCGGCACCTCTGTGCCAGATACATTTGCC 2772 

2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

II I I I I I I ! I II I I I I I I I I I II I II I I I I I II I I I I I I M I I II I I II III 
2773 AGCAAAGCCGCTGCCCTGCAGGACGTGTATGCAGATGCTTCCATTGGCAACGTCACAGGC 2832 

2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

II II I I I I I II I I I I I I I I I II M II II II I I I I I I I I I I I I II I I I I II II I I 
2833 AGTAATGCCGTCAATGTCTTCCTGGGTATTGGTTTGGCCTGGTCCGTGGCCGCCATCTAC 2892 

2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I II II II I I I I I I I I I II I I Mill II I I I I I I II II II II II II II I 

2893 TGGGCCATGCAGGGACAGGAGTTCCATGTGTCCGCTGGCACTCTGGCCTTCTCGGTCACT 2952 

2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 264 0 

II I I I I I I I I I I I II I II I I I I I II I II I I I I I I I II I II I II I I I I II I II 

2953 CTTTTCACCATCTTTGCATTTGTCTGCCTCAGTGTGCTCTTGTATCGTCGGCGGCCCCAT 3012 

2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

II II I I I I I I I I I II II II II I II I I II I I I I I Mill I I II II I II II II I I 
3013 CTGGGCGGGGAGCTCGGAGGTCCTCGTGGCTGCAAGCTTGCCACGACATGGCTCTTTGTG 3072 

2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

II II I I I II I I II II I II I I II II II II I I II I I I II II I I II II II I I I I II I I 
3073 AGCCTATGGCTCCTCTACATACTATTTGCCACGCTGGAGGCCTACTGCTACATCAAGGGG 3132 

2761 TTCTAA 2766 

I II I I 
3133 TTCTGA 3138 



RESULT 12 
RNU53420 

LOCUS RNU53420 4854 bp mRNA linear ROD 04-OCT-1996 

DEFINITION Rattus norvegicus sodium- calcium exchanger form 3 (NCX3) mRNA, 
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Location/Qualifiers 
1. .4854 

/organism="Rattus norvegicus" 
/mol_type="mRNA" 
/strain="Sprague-Dawley" 
/db_xref ="taxon : 10116" 
/map="tightly linked to D12Ucla3" 

/note="maps to chromosome 12 in mouse and 14q21-31 in 

human" 

1. .4854 

/gene="NCX3" 

834. .3617 

/gene="NCX3" 

/note="similar to human ncx2 product encoded by GenBank 
Accession Number X93017" 
/ codon_start=l 

/product="sodium-calcium exchanger form 3" 
/protein_id="AAC52817. 1" 
/db_xref ="GI : 1552526" 

/trans la tion="MAWLRLQPLTSAFLHFGLVTEVLFLNGLRAEAGDLRDVPSAGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREWIKKPNGETSTTTIRWNETVSNLTLMALGSSAPEILLSLIEVCGHGF 
IAGDLGPSTI VGSAAFNMFI 1 1 GI CVYVI PDGETRKI KHLRVFFVTAAWSVFAYIWLY 
MI LAVFS PGWQVWEGLLTLFFFPVCVXLAWVADKRLLFYKYMHKRYRTDKHRGI HE 
TEGEHPKGIEMDGKMMNSHFLDGNLIPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVEMAN Y YALSHQQKSRAFYRI QATRMMTGAGNI LKKHAAEQAKKTASMS EVHTDEP E 
DFASKVFFDPCSYQCLENCGAVLLTWRKGGDISKTMYVDYKTEDGSANAGADYEFTE 
GTVA^KPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRVEEEQLEEGMTPAILNSLPL 
P RAVLAS P CVATVT I LDDDHAGI FT FECDT I HVS E S I G VMEVKVLRT S GARGTVI VP F 
RTV^GTAKGGGEDFEDTYGELEFKNDETVKTIRVT<IvT)EEEYERQENFFIALGEPKWM 
ERGISALLLSPEVTDRKLTMEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKSTVDK 
LIKKTNLALWGTHSWRDQFMEAITVSAAGDEEEDESGEERLPSCFDYVMHFLTVFWK 
VLFACVP PTEYCHGWACFWS I LI I GMLTAI I GDLASH FGCT I GLKDSVTAWFVAFG 
T SVP DT FAS KAAALQ DVYAD AS I GNVT GSNAVNVFLGI GLAWSVAAI YWAMQGQE FHV 
SAGTLAFSWLFTIFAFVCLSVXLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYVL 
FATLEAYCYIKGF" 



ORIGIN 



Query Match 



85.0%; Score 2352.4; DB 10; Length 4854; 



Best Local Similarity 90.7%; Pred. No. 0; 

Matches 2525; Conservative 0; Mismatches 241; Indels 18; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I M I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II II II I I I I I 
Db 834 ATGGCGTGGTTACGGCTGCAGCCTCTCACCTCTGCCTTCCTCCATTTCGGGCTGGTTACT 893 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I II I I II I I I I I I I II II 
Db 894 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGACTTGAGGGATGTGCCCAGT 953 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GT T C AGGGT CAT C G GACT G CAAGGAGG GT GT CAT C CTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 954 GC AGGAC AGAACAAT GAGT CCT GT T C AGGGT CAT C AGACT G CAAGGAGGGT GT C AT CTT G 1013 

Qy 181 C CAAT CT GGT AC CC GGAGAACC CT T C CCTT GGGGACAAGAT T GC CAGGGT C ATT GT CT AT 240 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1014 C CAAT CT GGT AT CCAGAGAACC CT T C CC T T GGGGACAAGAT T GCAAG GGT C ATT GT CT AT 1073 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I II I I I I I I I I I I I 
Db 1074 T T T GTGGC CCT GAT AT ACAT GT TT CTTGGAGT GT CT AT CAT T GCT GACC GAT T CAT GGCA 1133 

Qy 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I 

Db 1134 T CT ATT GAAGTT ATT AC CT C C CAAGAGAGGGAGGT GACAAT CAAGAAGC C CAAT GGAGAG 1193 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

II I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1194 AC C AGC ACAACT ACAAT T C GGGT AT GGAAT GAAACT GTCT C CAAC CT GAC C CT GAT G GCC 1253 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

II II II I I I II I I I II II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I II 
Db 1254 CTAGGCTCTTCTGCTCCGGAGATTCTCCTGTCTTTAATTGAGGTGTGTGGTCACGGGTTC 1313 

Qy 481 ATT GCT GGT GAT CT GGGAC CTT CT AC CATT GT AGGGAGT GC AGC CT T CAACATGT T CAT C 540 

II I I I I I II I I I I I I I I II I I I I I I I I I I I II I I II I II I I I I I I I I I I I I I II I I 
Db 1314 ATTGCTGGTGATTTGGGACCGTCTACCATTGTCGGCAGTGCAGCCTTCAACATGTTCATC 1373 

Qy 541 ATCATT GGCATCTGT GTCTACGTGAT CCCAGACGGAGAGACTCGCAAGATCAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I II I I I I II I I I I I I II I I I I I I I II I I I I I I I I I I I II 

Db 1374 AT CATT GGCAT CT GT GT CTAT GT GAT CC C AGAT GGGGAGACT CGCAAGAT CAAGCAC CTT 1433 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I II I I I I I I I I I II I I 

Db 1434 CGAGTCTTCTTTGTCACGGCTGCTTGGAGCGTCTTTGCCTATATTTGGCTCTACATGATC 1493 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I 
Db 1494 CTGGCAGTCTTCTCTCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTTACTCTCTTCTTC 1553 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1554 TT T C CAGT GT GT GT C CT GCT GGCTT GGGT GGCAGATAAGC GACT GCTCTTCTACAAAT AC 1613 

Qy 781 AT GCACAAAAAGT AC CGCAC AGACAAAC AC C GAGGAATT AT CAT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I II I I II II I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1614 AT GC ACAAAAGAT AC C GC AC AGAT AAACACC GAGGAATT AT CAT T GAGAC AGAGGGT GAA 1673 

841 C ACC CTAAGGGC ATTGAGAT GGAT GGGAAAAT GAT GAATT C C C ATT TT CT AGAT GGGAAC 900 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I 
1674 C ACC CTAAGGGC ATTGAGAT GGAT GGGAAAAT GAT GAATT CT C ACT T C CT GGAT GGGAAC 1733 

901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGAT TCT C 960 

II I III I I I I I I I I I I I I II I II I I II I I I I I II I I I I I I I I I I I I I 

1734 CT T AT ACC CTT G GAAGGAAAGGAGGT AGAT GAAT CT C GCAGGGAAAT GAT CCGAAT TCTT 1793 

961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACT T AGAT C AGCT GGT G GAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1794 AAGGAT CT GAAGCAAAAACAC CCAGAAAAAGACTT AGAT C AGCT GGT G GAGAT GGCCAAT 1853 

1021 TACT AT GCTCT TT C CCAC CAACAGAAGAGCCGCGC CT T CT AC C GT AT C CAAGC CACTC GT 1080 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I II 

1854 TACT AT GCT CT TT C CC AC CAACAGAAGAGCC GT GCT T T CT AC C GCAT C CAAGC CACCC GG 1913 

1081 AT GAT GACTGGT GCAGGCAATAT C CT GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 
1914 AT GAT GACTGGT GCAGGCAATAT ACTTAAGAAAC AT G CAGC AGAGCAAGC CAAGAAGAC C 1973 

1141 T CCAGCAT GAGC GAGGT GCACAC CGATGAGC CTGAGGACT T T AT TT C CAAGGT CTT CT TT 1200 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I III 
1974 GCCAGCAT GAGT GAGGT GCAT ACT GAT GAGC CT GAGGACT T T GC CT C GAAGGT CT TTT T T 2033 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2034 GACCCATGCTCTTACCAGTGCCTGGAGAACTGTGGAGCTGTCCTCCTGACTGTGGTGAGG 2093 

12 61 AAAGG GGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAG GATGGTT CTGC C 1320 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I 
2094 AAAGG GGGAGAT AT AT CCAAGACT AT GT ACGT GGACT ACAAAACAGAG GACGG CT CT GC C 2153 

1321 AATGCAGGGGCT GACTAT GAGTTCACAGAGGGCACGGT GGTTCT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2154 AATGCAGGGGCT GACTAT GAGTT C AC AGAAGGCACT GT GGT TCT GAAG C C AGGAGAGACC 2213 

1381 CAGAAGGAGT T CT C C GT GGGCAT AATTGAT GACGAC AT TT TT GAGGAG GAT GAACACT T C 144 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I II 
2214 CAGAAGGAGT TCT CCGT GGGCAT C AT CGAT GAT GACAT TT T T GAAGAG GAT GAACACT T C 2273 

1441 T T TGTAAGGT T GAG CAAT GT CCG C AT AGAG GAGGAGC AGC C AGAGGAGGG GAT GC CT C CA 1500 

II II II I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II 

2274 TT CGTGAGACTGAGCAATGTCCGT GTAGAAGAGGAGCAGCTGGAAGAGGGGAT GACCCCC 2333 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 
II I I I I I I I I I I I I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
GCCATCCTCAATAGTCTTCCTTTGCCACGGGCTGTCCTGGCTTCCCCTTGTGTGGCCACA 2393 



2334 



1561 



2394 



1621 



GTTACCAT CTT GGATGAT GACCAT GCAGGCATCTT CACTTTTGAATGT GATACTATTCAT 1620 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II I I I 

GT AAC CAT CT T G GAT GAT G AC CAT G C AG GAAT TTT C AC T T T T GAAT GT GAT AC CAT T CAT 2453 



GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I II I 
2454 GTCAGTGAAAGTATT GGT GT TAT GGAAGT CAAGGT TTTGAGGAC AT CGGGTGCCCGGGGC 2513- 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 



1681 ACAGT CAT CGTC C C CTTT AGGAC AGT AGAAGGGAC AGC CAAGGGT GGCGGT GAGGACT T T 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I 
2514 ACAGT CAT CGT C C CT TTT AGGAC AGT AGAAGGAAC AGC CAAGGGT GGT GGT GAGGACTTT 2573 

1741 GAAGACACAT AT GGG GAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAAC C AT AAGGGT T 1800 

I I I I I II I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2574 GAAGATACTTATGGGGAGCT GGAGTTTAAGAAT GAT GAAACGGT GAAAAC C AT AAGGGTT 2633 

1801 AAAAT AGT AGAT GAGGAG GAAT AC GAAAGG CAAGAGAATTT CTT CATT GC C CT T GGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
2 634 AAAAT AGT AGAT GAGGAGGAGT AC GAAAGGCAAGAGAATTT CTTCATT GCCCTTGGT GAA 2 693 

1861 CC GAAAT GGAT GGAAGGT GGAAT AT C AGAT GT GACAGACAGG 1902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2694 C C GAAAT GGAT GGAAC GT GGAAT AT C AGC GCT C CT GTT AT CT C C AGAGGT GACAGACAG G 2753 

1903 AAGCT GACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGC AGAGAT GGGAAAGC CAGT ATT G 1962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2754 AAGCT GACT AT GGAGGAAGAGGAGGC CAAGAGAAT AGCAGAGAT GG GAAAGCC AGT AT T G 2813 

1963 GGT GAACACCCCAAACT AGAAGTCATCATTGAAGAGTCCTATGAGTTCAAGACTACGGT G 2022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III III 
2814 G GT GAACACCCTAAACT AGAGGT CAT CATT GAAGAGT C CT AT GAGT T CAAGAGT ACAGT G 2873 

2023 GACAAACT GAT CAAGAAGACAAAC CT GGCCTTGGTTGT GGGGACC C ATT C CT GGAGG GAC 2082 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2874 GATAAACT GAT CAAGAAGACAAAC CT GGCAT T GGT T GT GGGGAC C CAT T CCT GGAGGGAC 2 933 

2083 CAGT T CAT GGAGGC C AT CAC C GT CAGT GCAGC AGGGGAT GAGGAT GAGGAT GAAT C C GGG 2142 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
2934 CAATT CAT GGAAGC C AT CACT GTT AGT G CAGC AGGAGAT GAGGAGGAAGAT GAAT CT GGA 2993 

2143 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 2202 

I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2994 GAG GAGAGGCT GCC AT CAT GCT T T GACT AT GT C AT GCACTT CCT GAC GGT CT T TT GGAAG 3053 

2203 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 2262 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

3054 GTGCTCTTTGCCTGTGTGCCCCCCACAGAGTACTGCCATGGCTGGGCCTGCTTCGTGGTC 



2263 TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3114 T C CAT C CT CAT CAT C GGCAT GCT CAC CGC C AT CAT C GGGGACCT GG C CT CT CACT T C GGC 



3113 



2322 



3173 



2323 TGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCT 2382 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
3174 TGCACCATCGGGCTCAAGGATTCGGTCACAGCTGTTGTTTTTGTGGCATTCGGCACCTCT 



2383 GT C CC AGATAC GT TT GC CAG CAAAGCT GCTGCCCTC CAGGATGT AT AT GC AGAC GC CT C C 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
3234 GTGCCAGATACATTTGCCAGCAAAGCTGCTGCCCTGCAGGATGTGTATGCAGATGCTTCT 



3233 



2442 



3293 



2443 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 2502 

I I I I I I I I II II I I I I I II II I I I I I I I I I I I I I I I I I II II I I I I I I I I 
3294 ATTGGCAATGTCACCGGCAGTAATGCTGTCAATGT CTT CCTGGGT ATTGGTTTGGCCTGG 3353 



Qy 2503 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 2562 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I 
Db 3354 TCCGTCGCCGCCATCTACTGGGCCATGCAGGGACAGGAGTTCCATGTGTCCGCTGGCACT 3413 

Qy 2563 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 2622 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3414 CTGGCCTTCTCGGTCACTCTTTTCACCATCTTTGCATTTGTCTGCCTCAGTGTGCTCTTG 3473 

Qy 2623 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 2682 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II II II I I I I I I I I I I I I III 
Db 3474 TACCGTCGGCGGCCCCACCTGGGCGGGGAGCTTGGAGGTCCTCGTGGCTGCAAGCTTGCC 3533 

Qy 2683 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 2742 

I I I I I I I I I I I III I I I I I I II I I I III II II II I I I I I I I II III II II I I I I II 

Db 3534 ACAACGTGGCTCTTTGTGAGCCTGTGGCTCCTCTACGTACTCTTTGCCACGCTGGAGGCC 3593 

Qy 2743 TATTGCTACATCAAGGGGTTCTAA 2766 

II I I II I I I I I I I I I I I I I I I I 

Db 3594 TACTGCTACATCAAGGGGTTCTGA 3617 
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HSA508602 3838 bp mRNA linear PRI 20-JAN-2003 

Homo sapiens partial mRNA for Na+/Ca2+ exchanger isoform 4 (NACAIS4 
gene) . 
AJ508602 

AJ508602.1 GI:27805124 
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1 
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Homo sapiens partial mRNA for Na+/Ca2+ exchanger isoform 4 

Unpublished 
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Bongcam-Rudlof f , E. 
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Location/Qualifiers 

1. .3838 

/organism= ,f Homo sapiens" 

/mol_type="mRNA" 

/db_xref =" taxon : 9606" 

/ chr omo s ome= "14" 

/tissue i _type= l, brain" 

1. .3838 

/gene="NACAIS4" 

<1. .2316 

/gene="NACAIS4" 

/codon_start=l 

/product="Na+/Ca2+ exchanger isoform 4" 
/protein_id="CAD48420. 1" 
/db xref="GI:27805125" 



/ translation="SLIEVCGHGFIAGDLGPSTIVGSAAFNMFIIIGICVYVIPDGET 
RKI KHLRVFFI TAAWS I FAYIWLYMI LAVFS P GWQVWEG LLT L FF F PVCVL LAWVAD 
KRLLFYKYMHKKYRTDKHRGI 1 1 ETEGDHPKGI EMDGKMMNSHFLDGNLVPLEGKEVD 
ESRREMIRILKDLKQKHPEKDLDQLVEMANYYALSHQQKSRAFYRIQATR^IMTGAGNI 
LKKHAAEQAKKASSMSEVHTDEPEDFISKVFFDPCSYQCLENCGAVLLTWRKGGDMS 
KTMYVDYKTEDGSANAGADYEFTEGTWLKPRETQKEFSVGI I DDDI FEEDEHFFVRL 
S^AmIEEEQPEEGMPPAIFNSLPLPRAVLASPCVATVTILDDDHAGIFTFECDTIHVS 
ESIGVMGVKVLRTSGARGTVIVPFRTVEGTAKGGGEDFEDTYGELEFKNDETVKTIRV 
KIVDEEEYERQENFFIALGEPKWMERGISDVTDRKLTMEEEEAKRIAEMGKPVLGEHP 
KLEVIIEESYEFKTTVDKLIKKTNLALWGTHSWRDQFMEAITVSAAGDEDEDESGEE 
RL P S C FDYVMH FLTVFWKVLFACVP PT E YCHGWAC FAVS I LI I GMLTAI I GDLASHFG 
CT I GLKDS VTAWFVAFGT SVPDT FAS KAAALQDVYADAS I GNVTGSNAVNVFLGI GL 
AWSVAAIYWALQGQEFHVSAGTLAFSVTLFTIFAFVCISVLLYRRRPHLGGELGGPRG 
CKLATTWLFVSLWLLYILFATLEAYCYIKGF" 



ORIGIN 



Query Match 83.6%; Score 2312.8; DB 9; Length 3838; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2314; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 451 TCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATT 510 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATT 60 

Qy 511 GT AGGGAGT GCAGCCT T CAACAT GT T CAT CAT C ATT GG CAT CT GT GT CT AC GT GAT C C C A 570 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GT AGG GAGT GCAGCCT T CAACAT GT T CAT CAT CATT GG CAT CT GT GT CT AC GT GAT C C C A 120 

Qy 571 GAC GGAGAGACT C GCAAGAT C AAGC AT CT AC GAGT CTT CTT C AT C AC CG CT GCTT GGAGT 630 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 GAC GGAGAGACT C GCAAGAT CAAGCATCTAC GAGT CTT CTTC AT C AC CGCT GCTT GGAGT 180 

Qy 631 ATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAG 690 

I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I I I I I I I II I I I I I I 
Db 181 ATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAG 240 

Qy 691 GTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTG 750 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 241 GTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTG 300 

Qy 751 GCAGATAAAC GACTGCT CTT CT ACAAAT ACAT GCACAAAAAGT ACC GCAC AGACAAAC AC 810 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GCAGATAAAC GACTGCT CTT CT ACAAAT AC AT GCACAAAAAGT ACCGCAC AGACAAAC AC 360 

Qy 811 C GAGGAAT TAT C ATAGAGAC AGAGGGT GAC CACCCT AAGGGC AT T GAGAT GGAT GGGAAA 870 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 C GAGGAAT TAT C ATAGAGAC AGAGGGTGAC CACCCT AAGG GC AT T GAGAT GGATGGGAAA 420 

Qy 871 ATGATGAATTCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAGGAAGTGGAT 930 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AT GAT GAATT C C CAT T T T CT AGAT GGGAACCT G GT GC C C CT GGAAGGGAAGGAAGT GGAT 480 

Qy 931 GAGTCCCGCAGAGAGAT GATCCGGATTCTCAAGGATCT GAAGCAAAAACACCCAGAGAAG 990 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 GAGT C C CG CAGAGAGAT GATC C GGAT T CT CAAGGAT CT GAAGCAAAAAC AC CC AGAGAAG 54 0 



Qy 



991 



GACTT AGAT C AGCT GGT GGAGAT GGC CAAT TACT AT GCTCTTTCC C AC C AACAG AAGAGC 1 050 



1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 541 GACT T AGATCAGCT GGT GGAGAT GG C CAATTACT AT GCTCTTT C CCACCAAC AGAAGAGC 600 

Qy 1051 CGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAATATCCTGAAG 1110 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II II I I I I 

Db 601 CGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAATATCCTGAAG 660 

Qy 1111 AAAC AT GC AG CAGAACAAGC CAAGAAGGCCT C CAGCAT GAGC GAGGT GCACAC C GAT GAG 1170 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I 
Db 661 AAAC AT GC AGC AGAACAAGC CAAGAAGGC CT CCAGCAT GAGC GAGGT GCACAC C GAT GAG 720 

Qy 1171 C CT GAGGACTT T AT TT C CAAGGT CT T CTTT GACC CAT GTT CTT ACCAGT GCCT G GAGAAC 1230 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCTGAGGACTT TAT TTC CAAGGT CTT CTTT GACC CAT GTT CTTACCAGT GCCT GGAGAAC 780 

Qy 1231 TGTGGGGCTGTACT CCT GACAGT GGTGAGGAAAGGGGGAGACAT GT CAAAGACCAT GTAT 1290 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I 
Db 781 TGT GGGGCTGT ACT CCT GACAGT GGT GAGGAAAGGGGGAGAC AT GT CAAAGACCAT GTAT 840 

Qy 1291 GT GGACTACAAAACAGAGGATGGTT CTGCCAATGCAGGGGCTGACTATGAGTTCACAGAG 1350 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 GT GGACTACAAAACAGAGGATGGTT CTGCCAATGCAGGGGCTGACTATGAGTT CACAGAG 900 

Qy 1351 GGCACGGTGGTTCTGAAGCCAGGAGAGACCCAGAAGGAGTTCTCCGTGGGCATAATTGAT 1410 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 GGC AC GGT GGTT CT GAAGC CACGAGAGAC C CAGAAGGAGTT CT C C GT GGGC AT AATT GAT 960 

Qy 1411 GACGACATTTTTGAGGAGGATGAACACTT CTTTGTAAGGTT GAGCAATGT CCGCATAGAG 1470 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 GACGACATTTTT GAGGAGGATGAACACTT CTTTGTAAGGTT GAGCAATGT CCGCATAGAG 1020 

Qy 1471 GAGGAGCAGCCAGAGGAGGGGAT GC CT C CAGCAAT AT T CAACAGT CT T CCCTTGCCTCGG 1530 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 GAGGAGCAGCCAGAGGAGGGGATGCCTCCAGCAATATTCAACAGTCTTCCCTTGCCTCGG 1080 

Qy 1531 GCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATGCAGGC 1590 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATGCAGGC 1140 

Qy 1591 AT CT T C ACTT T T GAAT GT GAT ACT ATT CAT GT CAGT GAGAGT AT TGGT GT TAT GGAGGT C 1650 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 AT CTT C ACTT T T GAAT GT GAT ACT ATT CAT GT CAGT GAGAGT AT T GGT GT T AT GGGGGT C 1200 

Qy 1651 AAGGT T CT GC GGAC AT C AGGTGC C C GGGGTACAGT CAT CGT C CC CTTTAGGACAGT AGAA 1710 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 01 AAGGTT CT GC GGACAT CAGGT GC C C GGGGTACAGT CAT C GT C CC CT TTAGGACAGT AGAA 1260 

Qy 1711 GGGACAGCCAAGGGTGGCGGTGAGGACTTT GAAGACACATAT GGGGAGTT GGAATT CAAG 1770 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GGGACAGCCAAGGGT GGCGGTGAGGACTTT GAAGACACATAT GGGGAGTT GGAATT CAAG 1320 

Qy 1771 AAT GAT GAAACT GT GAAAAC CAT AAGGGT TAAAAT AGT AGAT GAGGAGGAAT AC GAAAGG 1830 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AATGAT GAAACT GT GAAAAC CAT AAGGGTTAAAAT AGT AGAT GAGGAGGAAT ACGAAAGG 1380 

Qy 1831 CAAGAGAATTT CTT CAT T GC CCTT GGT GAAC C GAAAT GGAT GGAACGT G GAAT AT CAGAT 1890 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1381 CAAGAGAATTTCTTCATTGCCCTTGGTGAACCGAAATGGATGGAACGTGGAATATCAGAT 1440 

Qy 1891 GT GACAGACAGGAAG CT GACTAT GGAAGAAGAGGAG GC CAAGAGGAT AGCAGAGAT GGGA 1950 

I I I I II I I I I I I I I I I II I I I It II I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I 

Db 1441 GT GACAGACAGGAAG CT GACTAT GGAAGAAGAGGAGGCCAAGAGGAT AG C AGAGAT GGGA 1500 

Qy 1951 AAGCCAGTATTGGGTGAACACCCCAAACTAGAAGTCAT CATTGAAGAGT C CTATGAGTT C 2010 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1501 AAGCCAGTATT GGGT GAACAC C C CAAACTAGAAGT CAT CATTGAAGAGT C CT AT GAGT T C 1560 

Qy 2011 AAGACTAC GGT GGAC AAACT GAT CAAGAAGACAAAC CT GGCCTT GGT T GT GGGGAC C CAT 2070 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AAGACTACGGTGGACAAACTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCAT 1620 

Qy 2071 T CCT GGAGGGACCAGT T CAT GGAGGC CAT C AC C GT CAGTGCAGCAGGGGAT GAGGAT GAG 2130 

I I I I I I I I I I I I I I I I I I I I I I .11 I I I I I I I I I I I II II I I I I I I I I I I I II I I II I I I I 

Db 1621 T C CT GGAGGGAC C AGT T CAT GGAGGC CAT CAC C GT CAGT GCAGCAGGGGAT GAGGAT GAG 1680 

Qy 2131 GATGAATCCGGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACT 2190 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1681 GATGAATCCGGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACT 1740 

Qy 2191 GTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCC 2250 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCC 18 00 

Qy 2251 TGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCC 2310 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1801 TGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCC 1860 

Qy 2311 TCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCA 2370 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 TCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCA 1920 

Qy 2371 TTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATAT 2430 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II II I 

Db 1921 TTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATAT 1980 

Qy 2431 GCAGACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATC 24 90 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GCAGACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATC 2040 

Qy 2491 GGCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTG 2550 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 GGCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTG 2100 

Qy 2551 TCGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATC 2610 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 TCGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATC 2160 

Qy 2611 AGCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGC 2670 

I I II I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db .2161 AGCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGC 2220 

Qy 2671 TGCAAGCTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCC 2730 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 TGCAAGCTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCC 2280 



Qy 2731 ACACTAGAG G CCT ATTGCT AC AT CAAGGGGT TCTAA 2766 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 ACACTAGAGGCCT ATTGCT ACATCAAGGGGTTCTAA 2316 
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Mus musculus sodium/ calcium exchanger (Slc8a3) mRNA, complete cds . 
AF453257 

AF453257 .1 GI : 17432810 

Mus musculus (house mouse) 
Mus musculus 
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mouse 
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Kraev, A. 

Direct Submission 

Submitted (27-NOV-2001 ) Mt. Sinai Hospital, Samuel Lunenfeld 
Research Institute, 600 University Avenue, Toronto, Ontario MSG 
1X5, Canada 

Location/Qualifiers 

1. .3435 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db_xref="taxon: 10090" 

/tissue_type="skeletal muscle" 

/de v_s t age= " adul t " 

1. .3435 

/gene="Slc8a3" 

603. .3389 

/gene="Slc8a3" 

/ codon_start=l 

/product=" sodium/ calcium exchanger" 
/protein_id="AAL39160. 1" 
/db_xref="GI : 17432811" 

/ translation="MAWLRLQPLTSAFLHFGLVT FVLFLNCLRAEAGDSGDVPSAGQN 
NESCSGSSDCKEGVILPIWYPENPSLGDKIARVIVYFVALIYMFLGVSIIADRFMASI 
EVITSQEREVTI KKPNGETSTTTI RVWNETVSNLTLMALGSSAPEI LLSLI EVCGHGF 
I AGDLGPSTI VGSAAFNMFI I IGI CVYVI PDGETRKI KHLRVFFVTAAWS I FAYIWLY 
MILAVFSPGWQVWEGLLTLFFFPVCVLLAWVADKRLLFYKYMHKKYRTDKHRGIIIE 
TEGDHPKGIEMDGKMMNSHFLDGNFTPLEGKEVDESRREMIRILKDLKQKHPEKDLDQ 
LVTiMANYYALSHQQKSRAFYRIQATRMMTGAGNILKKHAAEQAKKTSSMSEVHTDEPE 
DFASKVFFDPCSYQCLENCGAVLLTVVRKGGDISKTMYVDYKTEDGSANAGADYEFTE 
GTWLKPGETQKEFSVGIIDDDIFEEDEHFFVRLSNVRVEEEQLAEGMLPAILNSLPL 
P RAVLAS PCVAT VT I LDDDHAGI FT FECDT I HVS E S I G VMEVKVLRT SGARGTVIVPF 
RTVEGTAKGGGEDFEDAYGELEFKNDETVKTIHI KVI DDKAYEKNKNYVI EMMGPRMV 
DMSVQKALLLSPEVTDRKLTVEEEEAKRIAEMGKPVLGEHPKLEVIIEESYEFKSTVD 
KLIKKTNLALWGTHSWRDQFMEAITVSAGGDEDEDESGEERLPSCFDYVMHFLTVFW 



KVLFACVP PTEYCPGWAC FWS I LI I GMLTAI I GDLASHFGCT I GLKDS VTAWEVAF 
GT S VP DT FAS KAAALQDVYADAS I GNVT G SNAVNVFLG I G LAW S VAAI YWAMQGQ E FH 
VSAGTLAFSVTLFTIFAFVCLSVLLYRRRPHLGGELGGPRGCKLATTWLFVSLWLLYI 
LFATLEAYCYIKGF" 

ORIGIN 

Query Match 82.8%; Score 2290.2; DB 10; Length 3435; 

Best Local Similarity 89.3%; Pred. No. 0; 

Matches 2488; Conservative 0; Mismatches 278; Indels 21; Gaps 1; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 603 ATGGCGTGGTTACGGCTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACT 662 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I III I I I I I I I I I I II 

Db 663 TTTGTGCTCTTCCTGAATTGTCTTCGAGCAGAGGCTGGTGACTCGGGGGATGTGCCCAGT 722 

Qy 121 ACAG GGCAGAACAAT GAGT C CT GTT C AG GGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 18 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 723 GCAGGGCAGAACAAT GAGT CCT GTT CGGGGT CAT CAGACT GCAAGGAGGGT GTCATTTTG 782 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 783 CCAAT CT GGT AT C CAGAGAACC CTT C C CT T GGGGACAAGATT GCCAGGGT C ATTGT CT AT 842 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 843 TTTGTGGCCCTGATATACATGTTTCTTGGGGTGTCTATCATTGCTGACCGATTCATGGCA 902 

Qy 301 T CT ATT GAAGT CAT C AC CT CTCAAGAGAGGGAG GT GACAAT TAAGAAACC CAATGGAGAA 360 

I I I I I II I I I I I I I II II I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I 

Db 903 T CTAT T GAAGT CAT T ACT T C CCAAGAGAGG GAAGT GAC CAT CAAGAAGCC CAAT GGAGAG 962 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 963 ACCAGCACAACT ACAATT CGGGTAT GGAAT GAAACT GTCT CCAAT CT GACCCTGAT GGCC 1022 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1023 CTGGGCTCTTCTGCTCCAGAGATTCTCCTGTCTTTAATTGAGGTGTGTGGTCACGGGTTC 1082 

Qy 481 AT T GCTGGT GAT CT G GGAC CTT CT AC CATT GTAGGGAGT GCAGC CT T CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I II I II I I I I I I I I I I I I I I I I I 

Db 1083 AT T GCT GGT GAT CTG GGAC CAT CTACCATC GTT GGCAGT GCAGC CTT CAACAT GTT CATC 1142 

Qy 541 AT CATTGGCATCT GT GT CTACGTGATCCCAGACGGAGAGACT CGCAAGAT CAAGCAT CTA 600 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I II I I II 

Db 1143 AT CATTGGCATCT GT GT CTATGTGATCCCAGATGGGGAGACT CGAAAGAT CAAGCACCTG 1202 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1203 CGAGTCTTCTTCGTCACGGCTGCTTGGAGCATCTTCGCCTACATTTGGCTCTATATGATC 1262 



Qy 

Db 



661 
1263 



720 
1322 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



721 



1323 



781 



TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTCCCGTGTGTGTCCTGCTGGCTTGGGTGGCAGATAAGCGACTGCTCTTCTACAAATAC 



780 



1382 



840 



AT GCACAAAAAGT AC C GC AC AGACAAACACC GAGGAATT AT CAT AGAGAC AGAGGGT GAC 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1383 AT GCACAAAAAAT AC C GC AC AGATAAACACC GAGGAATT AT CATT GAGAC AGAGGGT GAC 1442 

841 CACCCTAAGGGCATTGAGAT GGATGGGAAAAT GAT GAATTCCCATTTTCT AGATGGGAAC 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I 
1443 CACCCTAAGGGCATTGAGAT GGATGGGAAAAT GAT GAATTCTCACTTTCTAGAT GGGAAC 1502 

901 CT GGT GCCC CT GGAAGGGAAG GAAGT GGAT GAGT CCC GC AGAGAGAT GAT C CGGAT T CT C 960 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1503 TT T AC ACCTT T GGAAGGAAAG GAGGT AGAT GAAT CT C GCAGGGAAAT GAT C CGGAT T CT A 1562 

961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1563 AAGGATCTGAAACAAAAACAC CCAGAAAAGGACCTAGATCAGCTGGT GGAGAT GGCCAAT 1622 

1021 T ACT ATGCT CT TT C C CAC CAACAGAAGAGCCGC GCCT T CTAC C GT AT C CAAGCCAC T C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I II 
1623 TACT ATGCT CT TT C C CAT CAACAGAAGAGC C GT GCTT T CTACC GCAT C CAAGC C AC CC GG 1682 

1081 AT GATGACT GGT GC AGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAG CCAAGAAGGC C 114 0 

I I I I I I I I I I I I I I I I I I I I I I II II I II I I I I I I I I II I I I I I I I I I I I I II 
1683 AT GAT GACT GGT GC GGGCAAT AT ACT TAAGAAGCAT GCAGCCGAGCAAG C CAAGAAGAC C 1742 

1141 T CCAGCAT GAGCGAGGT G CACAC C GAT GAGC CT GAGGACTTTATTT C CAAGGT CT T CT T T 1200 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1743 T CCAGCAT GAGCGAGGT G CAT AC C GAT GAGC CGGAGGACTTT GC CT CTAAGGT CT T CTT T 1802 

1201 GACC CAT GTT CTT AC C AGT GC CT GGAGAACT GT GG GGCTGTACT C C T GACAGT GGT GAG G 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I 
1803 GACCCATGTTCTTATCAGTGCCTGGAGAACTGTGGAGCTGTCCTCCTGACCGTGGTGAGG 1862 

1261 AAAG GGGGAGACAT GT CAAAGACCAT GT AT GT GGACT ACAAAAC AGAGGAT GGT T CT GC C 1320 

I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II II III 
1863 AAAGGGGGAGATATAT CCAAGACCAT GTACGT GGACT ACAAAACAGAGGACGGCTCCGCC 1922 

1321 AAT GCAGGGGCT GACTAT GAGTT CACAGAGGGCAC GGTGGTT CTGAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1923 AAT GCAGGGGCAGACTAT GAGTT CACAGAGGGCACTGTGGTTCTGAAGCCAGGAGAGACC 1982 

1381 CAGAAGGAGTT CT CCGTGGGCATAATTGATGACGACATTTTT GAGGAGGAT GAACACTT C 1440 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGAAGGAGTT CT CT GTGGGCAT CATTGATGAT GACATTTTT GAGGAGGAT GAACACTT C 



1983 



2042 



1441 T TT GTAAGGT T GAG CAAT GT C C GCAT AGAGGAG GAGCAGCC AGAGGAG GGGAT GCCT C C A 1500 

I I I I I III I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2043 T T T GTGAGGCT GAGCAAT GT C C GT GT AGAAGAGGAGCAGCT GGCGGAGGGGAT G CT C C C A 2102 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2103 GCAATACTCAATAGTCTTCCTTTGCCTCGGGCTGTCCTGGCCTCCCCTTGTGTGGCCACA 2162 



Qy 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2163 GTAACCAT CTT GGAT GATGACCATGCAGGAATTTTCACTTTTGAATGTGATACCATT CAT 2222 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I 
Db 2223 GTCAGTGAAAGTATTGGTGTTATGGAAGTCAAGGTTTTGAGGACATCAGGTGCCAGGGGC 2282 

Qy 1681 ACAGT CAT C GT C C C CTT T AGGACAGT AGAAG GGACAGC C AAGGGT GGCGGT GAG GACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I 

Db 2283 ACAGT CAT C GT C C CT TT T AGGACAGT AGAAGGGACAGCCAAGGGT GGT GG C GAGGACT TT 2342 

Qy 1741 GAAGAC ACAT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT GAAAAC CATAAGGGTT 1800 

II III II I I III II II I III I I I I I I I II II II I I I I II I III I I I I 

Db 2343 GAAGAT GCAT AT GGGGAGCTGGAGTT CAAGAAT GAT GAAACAGTCAAAACAATT CACATC 2402 

Qy 1801 AAAAT AGT AGAT GAGGAG GAAT AC GAAAGGCAAGAGAATT T CTT CAT T GC C CT T GGT GAA 1860 

II I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 
Db 2403 AAG GTAATT GAT G AT AAGGC GT AT GAGAAAAACAAGAATT ACGT C ATT GAGAT GAT GGGC 24 62 

Qy 1861 CCGAAATGGATGGAACGTGGAATAT C AG AT GT G AC AGAC 1899 

II I I I II II I I II I I I I I I I I I 

Db 24 63 C CC C GC AT GGTGGAT AT GAGT GTT C AGAAAGCGCT C CT GTT AT CT C C AGAAGT GACAGAC 2522 

Qy 1900 AGGAAG CT GACT AT GGAAGAAGAGGAGGCCAAGAGGATAGCAGAGAT GGGAAAGCCAGTA 1959 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2523 AGGAAG CT GACT GT GGAG GAAGAGGAAGCC AAGAGAAT AGCAGAGAT GGGAAAGC CAGTA 2582 

Qy 1960 T TGGGTGAAC AC CCCAAACT AGAAGT CATCATTGAAGAGT CCTATGAGTT CAAGACTACG 2019 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml 

Db 2583 T T GGGT GAACAC C C CAAACT AGAGGT CAT C ATT GAAGAGT C CT AT GAGTT CAAGAGT ACA 2642 

Qy 2020 GT G GACAAACT GAT CAAGAAGACAAACCT GG CCTT GGTT GT GGGGACCC AT T C CT GGAGG 2079 

I I I II II I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 264 3 GT GGATAAGCT GAT CAAGAAGACAAACCT GGCATTGGTT GT GGGGACCCATT CCTGGAGG 2702 

Qy 2080 GAC C AGTT CAT GGAGGCCAT CAC C GT CAGT GC AGCAGGGGAT GAGGAT GAGGAT GAAT CC 2139 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I II 

Db 2703 GAC CAGTT C AT GGAAGC CAT CACT GT TAGT GCAGGAGGGGAT GAGGAT GAAGAC GAAT CT 2762 

Qy 214 0 GGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGG 2199 

II I I I I I II I I I I I I I II I I II I II I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I 

Db 2763 GGAGAG GAGAGGCT GCC AT C CT GCT TT GACTAC GT CAT GCACTT C CT GAC GGT CT T CT GG 2822 

Qy 2200 AAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCC 2259 

I I I I I I II I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I II I 
Db 2823 AAGGTGCTCTTTGCCTGTGTGCCCCCCACAGAGTACTGCCCCGGCTGGGCCTGCTTCGTG 2882 

Qy 2260 GTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTC 2319 

I I I I I I I Ml I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I II II I MUM 
Db 2883 GTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATCGGGGACCTGGCCTCTCACTTC 2942 

Qy 2320 GGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACC 2379 

I I I II I I I I I I II I I I II I I I II I I II I I I II I I I II I II I I II I II I II I I II 
Db 2943 GGCTGCACCATCGGGCTCAAGGATTCGGTCACAGCTGTTGTTTTTGTGGCATTCGGCACC 3002 

Qy 2380 T CT GT C C C AGAT AC GTT T GC CAGCAAAGCT GCT GCC CT CC AGGAT GT AT AT G CAGACG CC 2439 



Db 



3003 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 

T CT GTGC CAGAT ACATT T GC C AGCAAAGC C GCT G C C CT G CAGGAC GT GT AT GCAGAT GCT 3062 



Qy 2440 TCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCC 2499 

I I I I I I I I I I I I I I II I I I I I II I I I II I I I I I I II I I I I I I I II II I I I I I 
Db 3063 TCCATTGGCAACGTCACAGGCAGTAATGCCGTCAATGTCTTCCTGGGTATTGGTTTGGCC 3122 

Qy 2500 TGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGC 2559 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 3123 TGGTCCGTGGCCGCCATCTACTGGGCCATGCAGGGACAGGAGTTCCATGTGTCCGCTGGC 3182 

Qy 2560 ACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTC 2619 

II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3183 ACTCTGGCCTTCTCGGTCACTCTTTTCACCATCTTTGCATTTGTCTGCCTCAGTGTGCTC 3242 

Qy 2620 TTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTC 2679 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3243 TTGTATCGTCGGCGGCCCCATCTGGGCGGGGAGCTCGGAGGTCCTCGTGGCTGCAAGCTT 3302 

Qy 2680 GCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAG 2739 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 33 03 GC CACGACAT GGCT CTT T GT GAGC C TAT GGCT C CT CT AC AT ACT AT T TGCCACGCT GGAG 3362 

Qy 2740 GC CT ATT GCT AC AT CAAGGGGTTCTAA 2766 

I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3363 GCCTACT GCT ACATCAAGGGGTT CT GA 3389 



RESULT 15 

HSNCX22 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



COMMENT 
FEATURES 

source 



HSNCX22 2534 bp DNA linear PRI 12-NOV-2000 

Homo sapiens partial SCL8A3 gene for solute carrier family 8 
(sodium/ calcium exchanger), member 3 (SCL8A3), exon 2. 
X93017 

X93017.1 GI:1067133 

SLC8A3 gene; sodium- calcium exchanger. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Kraev,A. , Chumakov, I . and Carafoli,E. 

The organization of the human gene NCX1 encoding the sodium- calcium 
exchanger 

Genomics 37 (1), 105-112 (1996) 

97079665 

8921376 

2 (bases 1 to 2534) 

Kraev,A.S. 

Direct Submission 

Submitted ( 14-NOV-1995) A.S. Kraev, Swiss Federal Institute of 
Technology, Laboratory of Biochemistry III, Universitaetstr . 16, 
Zurich, CH-8092, SWITZERLAND 
Similar to X91213. 

Location/Qualifiers 

1. .2534 

/organism="Homo sapiens " 



gene 



exon 



/ mo l_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/chromosome=" 14 11 
/map="q24.1" 
/cellJLine="WI38" 
/cell_type="fibroblast" 
/ tissue_type="lung" 

/clone_lib="Stratagene genomic #946204" 

281. .2126 

/gene="SLC8A3 " 

281. .2126 

/gene="SLC8A3" 

/product="solute carrier family 8 (sodium/ calcium 
exchanger) , member 3" 
/ number =2 



ORIGIN 



Query Match 64.6%; 
Best Local Similarity 99.9%; 
Matches 1787; Conservative 



Score 1786.4; 
Pred. No. 0; 
0; Mismatches 



DB 9; Length 2534; 



1; Indels 



0; Gaps 



0; 



Qy 

Db 



343 



ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 4 02 



Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 
I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
4 03 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 4 62 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



121 ACAGG GCAGAACAAT GAGT C CT GTT CAGGGT C ATCGGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
463 AC AG G GCAGAACAAT GAGT C CT GTT CAGGGT C ATCGGACT GCAAGGAGGGT GT CAT C CT G 522 

181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
523 CCAAT CT GGT AC C CGGAGAACC CT T C C CT T GGGGACAAGATT GC CAGGGT CAT T GT CT AT 582 

241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
583 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 

301 T CTAT T GAAGT CATCAC CT CT CAAGAGAGGGAG GT GACAATT AAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
643 TCTATTGAAGTCATCACCT CTCAAGAGAGGGAGGTGACAATTAAGAAACCCAAT GGAGAA 702 

361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
703 ACCAGCACAAC CACT AT T C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CT T AT GG C C 762 

421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
763 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 



Qy 

Db 



481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 
I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
823 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 



540 
882 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



541 



883 



601 



943 



661 



ATCATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I II I I I I I II I I 
AT CATT GGCAT CT GT GT CT ACGT GAT CC CAGACGGAGAGACT C GCAAGAT CAAGC AT CT A 942 



CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 



660 



1002 



720 



CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 



721 



1063 



781 



1123 



841 



TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I II II I I I I I II I II I I I II III I I I I I I I I I I I II II III I I I I I I I II III I I I I I I I 
TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 

ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 840 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GC ACAAAAAGT AC C GCAC AGACAAACAC CGAGGAATTAT CAT AGAGAC AGAGGGT GAC 1182 



CACC CTAAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATT CC C ATT T T CT AGAT GGGAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1183 CACC CTAAGGG CAT T GAGAT GGAT GGGAAAAT GAT GAATT CC CATT T T CT AGAT GGGAAC 



900 



1242 



960 



901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT C C G GAT TCT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1243 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT CC G GAT T CT C 1302 

961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACTT AGAT CAGCT GGT G GAGAT GGCCAAT 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1303 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACTT AGAT C AG CT GGT GGAGAT GGCCAAT 1362 

1021 TACT AT GCTCTT T C C CAC CAAC AGAAGAGC C GCGC CT T CT AC C GT AT C CAAGC CACTC GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1363 TACT AT GCTCTTT C C CAC CAAC AGAAGAGC C GCGC CTT CT AC C GT AT C CAAGC CACTC GT 1422 

1081 AT GAT GACTGGT GC AGGCAATAT C CT GAAGAAACAT GC AGC AGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1423 AT GAT GACTGGT GC AGGCAATAT C CT GAAGAAACAT GCAGC AGAACAAGC CAAGAAGGC C 1482 

1141 T CCAGC AT GAGC GAGGT G C ACACC GAT GAGCCTGAGGACT T T AT TT C CAAGGT CT T CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1483 T C CAG CAT GAGC GAGGT GC ACACC GAT GAGCCT GAGGACTT T AT TT C CAAGGT CT T CT T T 1542 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 



1543 



1602 



1261 AAAGGGGGAGAC AT GT C AAAGACC AT GT AT GT GGACT ACAAAAC AGAG GAT GGTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1603 AAAGGGGGAGAC AT GT C AAAGAC CAT GTAT GT GGACT ACAAAAC AGAG GAT GGTT CT GC C 1662 

1321 AATGCAG GGG CT GACT AT GAGTT C ACAGAGGGCAC GGT GGTT CT GAAG CC AGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1663 AATGCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGACC 1722 

1381 CAGAAGGAGT T CT C CGT G GG CATAATT GAT GACGACATTT TT GAGGAGGAT GAAC ACT T C 1440 



Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1723 



I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGAAGGAGTT CT CC GT GGGC AT AATT GAT GAC GACATTTTT GAGGAGGAT GAACACTT C 1782 



1500 



1441 T T T GT AAGGT T GAGC AAT GT C C GCATAGAGGAGGAG C AGCCAGAGGAGGGGAT GC CT C CA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
1783 TT T GTAAGGTT GAGC AAT GT C C G CAT AGAGGAGGAG CAGCCAGAGGAGGGGAT GC CT C CA 1842 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

1561 GTT ACCATCTTGGATGATGACCATGCAGGCATCTT CACTTTTGAAT GT GATACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1903 - GTT AC CAT CT T GGAT GAT GAG CAT GCAGGC AT CTT C ACTTTT GAAT GT GAT ACT AT T CAT 1962 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1963 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2022 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2023 ACAGT C AT CGT CCC CT TT AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACT T T 2082 

1741 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAA 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2083 GAAGACACAT AT G GGGAGT T GGAAT T CAAGAAT GAT GAAACTGT GT AA 2130 



Search completed: June 25, 2004, 12:31:10 
Job time : 10422.3 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence: 

Scoring table: 



Searched: 



June 25, 2004, 00:42:04 



US-10-054-680-1 
2766 

1 atggcgtggttaaggttgca. 



Search time 970.401 Seconds 
(without alignments) 
12108.934 Million cell updates/sec 



. gctacatcaaggggttctaa 2766 



I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 



3373863 seqs, 2124099041 residues 
Total number of hits satisfying chosen parameters: 



6747726 



Minimum DB seq length: 
Maximum DB seq length: 



2000000000 



Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : 



N_Geneseq_29Jan04: 



1 
2 
3 
4 
5 
6 
7 
8 
9 

10 



geneseqnl980s : * 
geneseqnl990s : * 
geneseqn2000s : * 
geneseqn2001as : * 
geneseqn2001bs : * 
geneseqn2002s : * 
geneseqn2003as : * 
geneseqn2003bs : * 
geneseqn2003cs : * 
geneseqn2004s : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



Result 



% 

Query 



sjo. 


Score 


Match 


Length 


DB 


ID 


1 


2766 


100. 


0 


2766 


6 


ABQ78861 


2 


2766 


100. 


0 


3812 


6 


ABQ78863 


3 


2764.4 


99. 


9 


2766 


6 


ABQ78864 


4 


2764.4 


99. 


9 


2966 


6 


ABZ33735 


5 


2761.2 


99. 


8 


2782 


6 


ABN83428 


6 


2753 


99. 


5 


2769 


6 


ABQ78865 


7 


2751.4 


99. 


5 


2769 


6 


ABQ78866 



Description 



Abq78861 Human ion 
Abq78863 Human ion 
Abq78864 Human ion 
Abz33735 Human TRI 
Abn8342 8 Human tra 
Abq78865 Human ion 
Abq78866 Human ion 





8 


2733 . 4 


98 . 


8 


2781 


6 


ABA04756 


Aba04756 


Human nat 




9 


2673.2 


96. 


6 


2685 


7 


ABX56263 


Abx56263 


Human NOV 




10 


2657 . 6 


96. 


1 


2840 


7 


ABX56262 


Abx56262 


Human NOV 




11 


2367 . 2 


85. 


6 


2813 


7 


ABX56261 


Abx56261 


Human NOV 




12 
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2 
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8 
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2 


4291 
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6 
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ALIGNMENTS 



RESULT 1 
ABQ78861 

ID ABQ78861 standard; cDNA; 2766 BP. 
XX 

AC ABQ78861; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein #1 cDNA. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; chromosome 14. 
XX 



OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .2766 

FT /*tag= a 

FT /product= "Ion exchanger protein 1" 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P. 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 

DR P-PSDB; ABB81913. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins, 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Claim 1; Page 36-37; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP), 

CC that shares structural similarity with mammalian sodium- calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence encodes a NHIEP of the invention 

XX 

SQ Sequence 2766 BP; 655 A; 678 C; 760 G; 673 T; 0 U; 0 Other; 

Query Match 100.0%; Score 2766; DB 6; Length 2766; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2766; Conservative 0; Mismatches 0; Indels 0; Gaps 0 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

II I I I I I I I I I I I I I I II I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 



Qy 121 ACAGGG C AGAAC AAT GAGT C CT GT T CAGG GT CAT C GGACT GCAAG GAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAATGAGT CCTGTTCAGGGT CATC GGACT GCAAG GAGGGT GTCAT CCTG 180 



Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I II I I I III I I I I I I I I I I I I I I I I I I I I I I II II I I II II I I I I I III II I I I I I I I 

Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 ATT GCTGGT GAT CTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTT CATC 540 

Qy 541 ATCATTGGCATCT GTGT CTACGTGATCCCAGACGGAGAGACT CGCAAGATCAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 ATCATTGGCAT CTGT GT CTACGTGATCCCAGACGGAGAGACT CGCAAGATCAAGCAT CTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGT AC CGCACAGACAAACAC CGAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 AT GCACAAAAAGT AC CGCACAGACAAACAC CGAGGAAT TAT CAT AGAGACAGAGGGT GAC 840 

Qy 841 CAC CCT AAG G GCATT GAGAT GGAT GGGAAAAT GAT GAATT C C CAT TT T CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CAC CC TAAGG G CATT GAGAT G GAT GGGAAAAT GAT GAATT C C CAT TT T CT AGAT GGGAAC 900 

Qy 901 CT GGT GC C C CT GGAAGGGAAGGAAGT GGAT GAGT C CC GC AGAGAGAT GAT C C GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 901 CT GGT GC C C CT GGAAGGGAAG GAAGT GGAT GAGT CCC GCAGAGAGAT GAT C C GGAT T CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAAC AC CCAGAGAAGGACT T AGAT C AGCT GGT GGAGAT GG C CAAT 1020 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAG GAT CT GAAGCAAAAAC AC CCAGAGAAGGACTT AGAT C AGCT GGT G GAGAT GG C CAAT 1020 



Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

1081 AT GAT GACT GGT GC AGGCAAT AT CCT GAAGAAAC AT GC AGC AGAACAAG C CAAGAAGG C C 1140 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I 
1081 AT GAT GACT GGT GC AGGCAAT AT CCT GAAGAAAC AT GC AGC AGAACAAG C CAAGAAGGC C 1140 

1141 T C C AGCAT GAGC GAGGTG C AC AC C GAT GAGC CT GAG GACT T T ATT T C CAAGGTCT T CTT T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T C CAGCAT GAG C GAGGTG C AC AC C GAT GAGC CT GAGGACTTTATTT CCAAGGTCT T CTT T 1200 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 



1261 



1261 



1321 



AAAGGG GGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGT T CT GC C 1320 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAGGGGGAGACATGTCAAAGACCATGTATGT GGACT ACAAAACAGAGGAT GGTTCTGCC 1320 



AAT GCAGGGGCT GACT AT GAGTT CAC AGAGGGC ACGGT G GTT CT GAAGC CAGGAGAGAC C 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AAT GCAGGGGCT GAC TAT GAGTT CAC AGAGGGC ACGGT GGTT CT GAAGC CAGGAGAGAC C 1380 

1381 CAGAAGGAGT T CT C CGT GGGCAT AATT GAT GAC GACAT TT TT GAGGAGGAT GAAC ACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CAGAAGGAGT T CT C C GTGGGC ATAATT GAT GAC GACATTT TT GAGGAGGAT GAAC ACTT C 1440 

14 41 T TT GTAAGGT T GAGCAAT GT C CGC AT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT CC A 1500 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1441 T TT GTAAGGT T GAGCAAT GT C CGC AT AGAGGAGGAGCAG CCAGAGGAG GGGAT GC CT CC A 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GTT AC C AT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTT TT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GTT AC CAT CTT GGAT GAT GAC CAT GCAGG CAT CTT CACT T TT GAAT GT GAT ACT ATT CAT 1620 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

1681 AC AGT CAT CGT C CC CTTTAGGACAGTAGAAGG GACAG C CAAGGGT GGC GGT GAGGACT T T 1740 

I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1681 AC AGT CAT CGT C CC CTT T AG GACAGT AGAAGG GACAG C CAAG GGT GGC GGT GAGGACT T T 1740 

1741 GAAGACACATAT GGGGAGTT GGAATTCAAGAATGAT GAAACTGTGAAAACCATAAGGGTT 1800 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1741 GAAGACACATAT GGGGAGTT GGAATTCAAGAATGAT GAAACTGTGAAAACCATAAGGGTT 1800 

1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAATTT CTT C AT TGCCCTTGGT GAA 1860 

I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGG CAAGAGAATTT CTT CAT T GC C CTT GGT GAA 1860 

1861 CCGAAAT GGAT G GAAC GTGGAAT AT C AGAT GT GACAGACAGGAAGCTGACTATGGAAGAA 1920 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1861 CCGAAATGGAT GGAAC GT GGAAT AT CAGAT GT GACAGAC AGGAAGCT GACT AT GGAAGAA 1920 

Qy 1921 GAGGAGGCCAAGAGG AT AGCAGAGAT GGGAAAGCC AGT AT TGG GT GAAC AC C C CAAACTA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 1921 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGCC AGT AT TGGGT GAACAC C C CAAACTA 1980 

Qy 1981 GAAGT CAT CATTGAAGAGT CCT AT GAGTTCAAGACTACGGTGGACAAACT GATCAAGAAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GAAGT CAT CATT GAAGAGT C CT AT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2040 

Qy 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

Qy 2101 AC C GT C AGT GCAGCAGGGGATGAGGAT GAGGAT GAAT CC GGGGAGGAGAGGCT GCC CT C C 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC C GT C AGT GC AGCAGGGGAT GAGGAT GAGGAT GAAT C C GGGGAGGAGAG GCT GC C CT C C 2160 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

Qy 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 234 0 

Qy 2341 GAT T CAGT CAC AGCT GTT GT TTT C GT GGCAT TT GGC AC CT CT GT CC CAGAT AC GTT T GC C 2400 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 24 00 

Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

Qy 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

Qy 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 264 0 

Qy 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

Qy 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 



Qy 2761 TTCTAA 2766 

I I I I I I 

Db 2761 TTCTAA 2766 



RESULT 2 
ABQ78863 

ID ABQ78863 standard; cDNA; 3812 BP. 
XX 

AC ABQ78863; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein cDNA #3. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; chromosome 14. 
XX 

OS Homo sapiens. 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins, 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders . 
XX 

PS Disclosure; Page 41-42; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium-calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence encodes a NHIEP of the invention, with regions of flanking 

CC sequence 

XX 

SQ Sequence 3812 BP; 860 A; 1059 C; 1041 G; 852 T; 0 U; 0 Other; 



Query Match 



100.0%; Score 2766; DB 6; Length 3812; 



Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2766; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 618 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 677 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 678 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 737 

Qy 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 738 ACAGGGC AGAACAAT GAGT C CT GT T C AGGGTC AT CGGAC T GCAAGGAGGGTGT CATC CT G 797 

Qy 181 C CAAT CT GGT ACC C GGAGAAC CCT T C C CT T GGGGACAAGATT GCCAGGGT CAT T GTCT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 798 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 857 

Qy 241 T TT GT G GCC CT GAT AT ACAT GTTCCTTGGGGTGTC CAT C ATT G CT GAC C G CT T C AT GG CA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 858 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 917 

Qy 301 TCTATTGAAGT CAT CACCTCT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 918 TCTATTGAAGT CAT CACCTCT CAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 977 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 978 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 1037 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1038 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1097 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1098 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 1157 

Qy 541 AT C ATT GGCAT CT GT GT CTAC GT GAT C C C AGAC GGAGAGACT C GCAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1158 AT C ATT GGCAT CT GT GTCTAC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGC AT CT A 1217 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1218 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1277 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1278 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1337 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1338 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1397 

Qy 781 AT GCACAAAAAGT AC CGC ACAGACAAACAC C GAGGAAT TAT CATAGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1398 AT GC ACAAAAAGT AC CGCACAGACAAACAC C GAGGAATT AT CAT AGAGACAGAGGGT GAC 1457 

Qy 841 CACCCTAAGGGCATT GAGATGGAT GGGAAAATGAT GAATTCCCATTTTCTAGATGGGAAC 900 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1458 CACCCTAAGGGCATT GAGATGGAT GGGAAAATGATGAATTCCCATTTTCTAGAT GGGAAC 1517 

Qy 901 CT GGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GATCCGGATT CTC 960 

I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1518 CTGGTGCCCCTGGAAGGGAAGGAAGTGGATGAGTCCCGCAGAGAGATGATCCGGATTCTC 1577 

Qy 961 AAGGAT CT GAAGC AAAAAC ACC CAGAGAAG GACTT AGAT CAG CTGGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1578 AAGGAT CT GAAGCAAAAAC AC C CAGAGAAGGACT T AGAT C AGCT GGT GGAGAT GGC CAAT 1637 

Qy 1021 TACT AT GCTCTTTCC C AC CAACAGAAGAGC CGC GC CT T CT AC CGT AT CCAAGC C ACT C GT 1080 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1638 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1697 

Qy 1081 AT GATGACT GGT GC AGGCAATAT C CT GAAGAAACAT GC AGCAGAACAAGC CAAGAAGG CC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1698 AT GATGACT GGT G C AGGCAATAT C CT GAAGAAACAT G CAG CAGAACAAGC CAAGAAGG CC 1757 

Qy 1141 T C CAGCAT GAGC GAGGT GC ACACC GAT GAG CCT GAGGACTT T AT T T C CAAGGT CTT CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1758 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1817 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1818 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1877 

Qy 1261 AAAGGGGGAGACATGTCAAAGACCATGTAT GT GGACT ACAAAACAGAGGATGGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1878 AAAGG GGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1937 

Qy 1321 AAT GC AGGGGCT GACT AT GAGTT CAC AGAGGGC AC GGT GGTT CT GAAGCC AGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1938 AAT GC AGGGGCT GACT AT GAGTT CACAGAGGG CAC G GT GGT T CT GAAG CC AGGAGAGACC 1997 

Qy 1381 CAGAAGGAGTT CT C C GT GGGCATAAT T GAT GAC GACATT T TT GAGGAGGAT GAAC ACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1998 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 2057 

Qy 1441 TTT GTAAGGTT GAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2058 TTT GTAAGGT T GAGCAAT GT C C GCAT AGAG GAGGAGC AGC CAGAGGAGGG GAT G C CT C CA 2117 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I II I I 
Db 2118 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2177 

Qy 1561 GTTAC CAT CTT GGAT GAT GAC CAT GCAGGC AT CTT CACTTTT GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2178 GTTAC CAT CTT GGAT GAT GAC CAT GCAGGC AT CTT CACT TT T GAAT GT GAT ACT AT T CAT 2237 

Qy 1621 GT CAGT GAGAGTATT GGT GTTAT GGAG GT C AAG GT TCT GCGGAC AT C AGGT GCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2238 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2297 



Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I 
Db 2298 AC AGT CAT CGT CC CCTT T AGGACAGTAGAAGGGACAGC CAAGGGT GGC GGT GAGGACT TT 2357 



Qy 1741 G AAG AC AC AT AT G GG G AGT T G G AAT T C AAG AAT GAT G AAAC T G T G AAAAC C AT AAG G G T T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2358 GAAGACACATATGGGGAGTTGGAATTCAAGAATGATGAAACTGTGAAAACCATAAGGGTT 2417 

Qy 1801 AAAATAGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CTT C AT T GCCCT T GGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2418 AAAATAGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CTT CAT TGCCCTTGGT GAA 2477 

Qy 1861 CCGAAATGGATGGAACGT GGAATAT CAGATGT GACAGACAGGAAGCT GACTAT GGAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2478 C CGAAAT GGAT GGAAC GT GGAATAT C AGAT GT GACAGACAGGAAG CT GACTAT GGAAGAA 2537 

Qy 1921 GAGGAGGCCAAGAGGATAGCAGAGATGGGAAAGCCAGTATTGGGTGAACACCCCAAACTA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2538 GAGGAGGCCAAGAGGATAGCAGAGATGGGAAAGCCAGTATT GGGT GAACACCCCAAACTA 2597 

Qy 1981 GAAGT CAT CATTGAAGAGTCCTATGAGTTCAAGACTACGGT GGACAAACT GATCAAGAAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2598 GAAGT CAT CATT GAAGAGT CCT AT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2657 

Qy 2041 ACAAAC CT GG C CT T GGTT GT GGGGAC C CAT T C CT GGAGGGAC CAGT T CAT GGAGG C CATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2658 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2717 

Qy 2101 AC C GT CAGT GC AGC AGGGGAT GAGGAT GAGGAT GAAT C CGGGGAGGAGAGGCT GC C CT CC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I 
Db 2718 AC C GT CAGT GC AG C AGGG GAT GAGGAT GAGGAT GAAT C C GGGGAGGAGAGGCT GC C CT CC 2777 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2778 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2837 

Qy 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2838 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2897 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2898 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2957 

Qy 2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2958 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 3017 

Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3018 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 3077 



Qy 

Db 



2461 
3078 



AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 



2520 
3137 



Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3138 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 

Qy 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3198 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 

Qy 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3258 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 

Qy 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II II I I II I I I I I I I I I I I I II 
Db 3318 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 

Qy 2761 TTCTAA 2766 

I I I I I I 

Db 3378 TTCTAA 3383 



RESULT 3 
ABQ78864 



ID ABQ78864 standard; cDNA; 2766 BP. 
XX 

AC ABQ78864; 
XX 

DT 09-OCT-2002 (first entry) 
XX 

DE Human ion exchanger protein #1 cDNA A/G mutant. 
XX 

KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; mutant. 
XX 

OS Homo sapiens. 

OS Synthetic. 
XX 

FH Key Location/Qualifiers 

FT mutation replace ( 1889, A) 

FT /*tag= a 



XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 

PR 23-JAN-2001; 2001US-0263384P . 
XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 



PT structurally related to mammalian sodium- calcium exchanger proteins , 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Disclosure; Page; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium- calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence represents a mutant form of a NHIEP of the invention. Note: The 

CC present sequence is not shown in the specification but is derived from 

CC the human NHIEP sequence shown as SEQ ID 1 (ABQ78861) 
XX 

SQ Sequence 2766 BP; 654 A; 678 C; 761 G; 673 T; 0 U; 0 Other; 

Query Match 99.9%; Score 2764.4; DB 6; Length 2766; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 27 65; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 AC AGGG C AGAACAAT GAGT C CT GTT CAGGGT CAT C G GACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AC AGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CTG 180 

Qy 181 CCAAT CT GGT AC C C GGAGAACCCTT CCCT T GGGGACAAGAT T GC CAGGGT CAT T GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 C CAAT CT G GTAC C CGGAGAACCCTTC CCT T GGGGACAAGAT TGC CAGGGT CAT TGTCT AT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT ATT GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T CTATT GAAGT CAT CACCTCTCAAGAGAGGGAGGT GACAAT TAAGAAAC CCAAT GGAGAA 360 

Qy 361 AC C AGC ACAAC CACT ATT C GGGT CTG GAAT GAAACT GT CT C CAAC CT GAC C CT T AT GGCC 420 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AC CAGCACAAC CACT AT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CTT AT GGCC. 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 



Qy 



481 



AT T GCT GGT GAT CT GGGAC CTT CTAC CATT GT AGG GAGT GC AGC CT T CAAC AT GT T CAT C 540 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 



540 



541 AT C ATT GGCAT CT GT GT CT ACGT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGC AT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 AT CATTGGCATCT GT GT CTACGT GATCC CAGACGGAGAGACT CGCAAGAT CAAGCATCTA 600 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 I M I 1 1 1 i I 1 1 M I 

601 C GAGT CT T CTT CAT C AC C GCT GCTT GGAGT ATCT TT GC CT ACAT CT GGCT CT ATAT GATT 660 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I 
661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 " 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 AT GCACAAAAAGT AC CGCACAGACAAACAC CGAGGAAT TAT C ATAGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7 81 AT GCACAAAAAGTAC CGCACAGACAAACAC CGAGGAATTAT C ATAGAGAC AGAGGGT GAC 840 

841 CAC CCT AAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT T CCCAT T TT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 CAC CCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT T C CCAT T TT CT AGAT GGGAAC 900 

901 CT GGT GC C C CT GGAAGGGAAGGAAGT GGAT GAGT C C C G CAGAGAGAT GAT C CGGAT T CTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CTGGTGCC C CT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT CCGGAT T CTC 960 

961 AAG GAT CT GAAGCAAAAACAC C CAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAG GAT CT GAAGCAAAAACAC C CAGAGAAGGACTT AGAT CAGCT GGT G GAGAT GGC CAAT 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGCC 1140 

1141 T C C AG CAT GAGC GAGGT GCACAC C GAT GAGC CT GAGGACT T T ATT T CCAAGGT CT T CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T C C AGCAT GAGC GAGGT GCACAC C GAT GAGC CT GAGGACT T TAT T T CCAAGGT CT T CT TT 1200 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GACC CAT GTT CTT AC CAGT GCCT GGAGAACT GT GGGGCT GT ACT CCT GAC AGT GGT GAGG 1260 

1261 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT G GACT ACAAAACAGAG GAT GGTT CT G C C 1320 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1261 AAAGGG GGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTTCTGCC 1320 

1321 AAT GCAGGGGCT GACTAT GAGT T CACAGAGGGC AC GGT GGTT CT GAAGC C AGGAGAG ACC 1380 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1321 AAT GCAGGG GCT GACT AT GAGTT CAC AGAGGGC ACGGT GGTT CTGAAGC C AGGAGAGAC C 1380 

Qy 1381 CAGAAGGAGTT CTCCGTGGGCATAATTGATGACGACATTTTT GAGGAGGATGAACACTT C 1440 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I 
Db 1381 CAGAAGGAGTT CTC C GT GGGC AT AATT GAT GAC GACATTTTT GAGGAGGAT GAACACTT C 144 0 

Qy 1441 T TT GTAAGGT T GAGCAAT GT C CGC ATAGAGGAGGAGCAGCC AGAGGAGGGGATGC CTC C A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T TT GTAAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGCAGC C AGAGGAGGGGAT GC CT C C A 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT CTT GGAT GAT GACCAT GC AGGCAT CT T C ACT TT T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GT TACC AT CTT GGAT GAT GAC CAT GCAGGCAT CT T CACT TTT GAAT GT GAT ACT AT T CAT 1620 

Qy 1621 GT CAGT GAGAGT AT T GGT GT TAT GGAGGT CAAGGTT CT GCGGAC AT CAGGT GCC CGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GT CAGT GAGAGT AT T GGT GTT AT GGAGGT CAAGGTTCTGCGGACAT CAGGT GCC CGGGGT 1680 

Qy 1681 ACAGT C AT CGT C CC CTT T AGGACAGT AGAAGGGACAG C CAAGGGT GGCGGT GAGGACT T T 174 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGT CAT C GT CCC CTT T AGGACAGT AGAAGGGACAG C CAAGGGT GGCGGT GAGGACT T T 174 0 

Qy 1741 GAAGAC ACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GT GAAAACCATAAGGGT T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GAAGAC AC AT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAACT GT GAAAACCATAAGGGT T 1800 

Qy 1801 AAAAT AGT AGAT GAGGAGGAATAC GAAAGGCAAGAGAATTT CTT CAT T G CC CTT GGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AAAAT AGT AGAT GAGGAGGAATAC GAAAGGCAAGAGAATTT CTT CAT T GCCCTT GGT GAA 1860 

Qy 1861 CCGAAAT GGAT GGAACGT GGAAT AT CAGAT GT GACAGACAGGAAGCT GACTATGGAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CC GAAAT GGAT GGAAC GT GGAAT AT CAGGT GT GACAGACAGGAAGCT GACT AT GGAAGAA 1920 

Qy 1921 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC C AGTATT GGGT GAACAC CCCAAACT A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 GAGGAG GC CAAGAGGAT AGCAGAGAT GGGAAAGC C AGTATT GGGT GAACAC CCCAAACT A 1980 

Qy 1981 GAAGT CAT CATT GAAGAGT CCT AT GAGT T CAAGACT AC GGT GGACAAACT GAT CAAGAAG 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GAAGT CAT CAT T GAAGAGT CCT AT GAGT T CAAGACT AC GGT GGACAAACT GAT CAAGAAG 204 0 

Qy 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

Qy 2101 AC CGT CAGT GCAGCAGG GGAT GAGGAT GAGGAT GAAT CC G GGGAGGAGAGGCT GC C CT C C 2160 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 ACCGTCAGTGCAGCAGGGGATGAGGATGAGGATGAATCCGGGGAGGAGAGGCTGCCCTCC 2160 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 



Qy 

Db 



2221 
2221 



CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 



2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 24 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 24 00 

2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 24 60 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I 

24 01 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 24 60 

2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2640 

2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 27 00 

2701 AGC CT GT GGCTC CT CT ACAT ACT CT T T GCC AC ACT AGAGGC CT AT T GCT ACAT CAAGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

2761 TTCTAA 2766 

I I I I I I 
2761 TTCTAA 2766 



RESULT 4 
ABZ33735 

ID ABZ33735 standard; cDNA; 2966 BP. 
XX 

AC ABZ33735; 
XX 

DT 30-JAN-2003 (first entry) 
XX 

DE Human TRICH encoding cDNA SEQ ID NO 41. 
XX 

KW Human; TRICH; transporter and ion channel; transport disorder; 

KW cystic fibrosis; diabetes mellitus; Parkinson ! s disease; cancer; 

KW neurological disorder; Alzheimer's disease; Huntington's disease; 

KW immunological disorder; AIDS; asthma; cell proliferative disorder; 

KW transgenic; gene therapy; neuroprotective; antidiabetic; cytostatic; 



KW antiparkinsonian; hypotensive; nootropic; antianaemic; anticonvulsant; 

KW cerebroprotective; cardiant; anti-HIV; human immunodeficiency virus; 

KW antiasthmatic; antiatherosclerotic; antigout; antiarteriosclerotic; 

KW hepatotropic; antiinflammatory; virucide; cytostatic; gene; ss. 
XX 

OS Homo sapiens. 
XX 

PN WO200246415-A2. 
XX 

PD 13-JUN-2002. 
XX 

PF 05-DEC-2001; 2001WO-US046963 . 
XX 

PR 08-DEC-2000; 

PR 15-DEC-2000; 

PR 21-DEC-2000; 

PR 12-JAN-2001; 

PR 19-JAN-2001; 

PR 26-JAN-2001; 

PR 02-FEB-2001; 
XX 

PA (INCY-) INCYTE GENOMICS INC. 
XX 

PI Lee EA, Baughn MR, Yue H, Ding L, Raumann BE, Hafalia AJA; 

PI Khan FA, Nguyen DB, Elliott VS, Ramkumar J, Walia NK, Ison CH; 

PI Lu Y, Gandhi AR, Warren BA, Duggan BM, Tribouley CM, Burford N; 

PI Lu DAM, Lai PG, Yao MG, Xu Y, Bruns CM, Thangavelu K, Swarnakar A; 

PI Tang YT, Azimzai Y, Thornton M, Arvizu C, Policky JL; 

XX 

DR WPI; 2002-519667/55. 

DR P-PSDB; ABP74104. 
XX 

PT Novel human transporter and ion channel polypeptide, useful in diagnosis, 

PT prevention or treatment of transport, neurological, muscle, immunological 

PT and cell proliferative disorders. 
XX 

PS Claim 96; SEQ ID NO 41; 146pp + Sequence Listing; English. 
XX 

CC The invention relates to human transporter and ion channel polypeptide 

CC (TRICH) (I) selected from one of 32 polypeptide sequences (ABP74096- 

CC ABP74127), a naturally occurring polypeptide comprising a sequence having 

CC at least sequence 90 % identity to (I) or a biologically active or 

CC immunogenic fragment of (I). (I) is useful for screening a compound for 

CC effectiveness as an agonist or antagonist, for screening a compound that 

CC specifically binds (I) or modulates the activity of (I) and for preparing 

CC a polyclonal or monoclonal antibody by hybridoma technology. 

CC Polynucleotides (II, ABZ33727-ABZ33758 ) encoding (I) are useful for 

CC screening a compound altering gene expression. (I) and (II) are useful in 

CC a diagnostic tests for a condition or a disease associated with the 

CC expression of TRICH in a biological sample, especially disorders selected 

CC from a transport disorder such as cystic fibrosis, diabetes mellitus, 

CC Parkinson's disease, cardiac disorders, neurological disorders such as 

CC Alzheimer's disease, Huntington's disease, muscle disorders, 

CC immunological disorder such as AIDS, asthma and atherosclerosis, and cell 

CC proliferative disorder such as arteriosclerosis, cirrhosis, hepatitis and 

CC cancer. (II) is useful for creating knock-in humanised animals or 

CC transgenic animals to model human diseases, in somatic or germline gene 



2000US-0254303P. 
2000US-0256190P. 
2000US-0257504P. 
2001US-0261546P. 
2001US-0262832P. 
2001US-0264377P. 
2001US-0266019P. 



CC therapy, to generate a transcript image of a tissue or cell type, for 

CC detecting differences in the chromosomal location due to translocation, 

CC inversion among normal, carrier or affected individuals and for mapping 

CC genomic sequences. Note: The sequence data for this patent is not 

CC represented in the printed specification but is based on sequence 

CC information supplied to Derwent by the European Patent Office 

XX 

SQ Sequence 2966 BP; 692 A; 725 C; 809 G; 740 T; 0 U; 0 Other; 

Query Match 99.9%; Score 2764.4; DB 6; Length 2966; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2765; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I 1 I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 201 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 260 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 261 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 320 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 321 ACAGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT CCT G 380 

Qy 181 C CAAT CT GGT AC CC GGAGAAC C CTT C C CT T GGGGACAAGATT GC CAGGGT CAT T GT CT AT 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 381 C CAAT CT GGT ACC C GGAGAAC C CTT C CCT T GGGGACAAGATT GC CAGGGT CAT T GT CT AT 440 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 441 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 500 

Qy 301 T CT ATT GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAAT T AAGAAAC CCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 501 T CT ATT GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAAT T AAGAAAC CCAAT GGAGAA 560 

Qy 361 ACC AGC ACAAC CACT AT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GACC CTT AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 561 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 620 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 621 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 680 

Qy 481 AT T GCT GGT GAT CT GGGAC CTT CT AC CATT GTAGGGAGT GCAGC CT T CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 681 AT T GCT GGT GAT CT GGGAC CTT CT AC CATT GTAGGGAGT GCAGC CTT CAACAT GTT CAT C 740 

Qy 541 AT CATT GGCAT CTGT GT CTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCAT CTA 600 

I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 741 AT C ATTGGCAT CT GT GT CT ACGT GAT C CCAGAC G GAGAGACT CGCAAGAT C AAGC AT CTA 800 



Qy 

Db 



601 
801 



CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 
I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 



660 
860 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 



661 



861 



721 



921 



781 



981 



841 



CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 

TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 



720 



920 



780 



980 



840 



AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGT GAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GC ACAAAAAGT AC C GCACAGACAAAC AC C GAGGAATT ATCAT AGAGAC AGAGGGT GAC 1040 



900 



CACCCTAAGGGCATT GAGAT GGAT GGGAAAATGAT GAATTCCCATTTT CT AGATGGGAAC 

in in in 1 1 1 ii n 1 1 ii ii it 1 1 ii i ii in ii mil it i in 1 1 n nm 1 1 n 

1041 CACCCTAAGGGCATT GAGATGGAT GGGAAAATGAT GAATTCCCATTTT CTAGATGGGAAC 1100 



901 



960 



CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT CC C GCAGAGAGAT GAT C C GGAT T CT C 
I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1101 CT GGT GC C C CT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT C C GGAT T CT C 1160 

961 AAGGAT CT GAAGCAAAAACAC C C AGAGAAGGACT T AGAT C AGCT GGT G GAGAT GG C C AAT 1020 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I III I I I I I I I I I I I I I I I I 
1161 AAGGAT CT GAAGCAAAAACAC C CAGAGAAG GACT T AGAT C AGCT GGT G GAGAT GGC C AAT 1220 



1021 T ACT AT GCTCT TT C C CAC CAACAGAAGAGC C £C G( 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I V\ 
1221 TACT AT GCTCT TT C CCAC CAACAGAAGAGCC GT ( 




iCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I 
CTTCTACCGTATCCAAGCCACTCGT 1280 



1081 AT GAT GACTGGT GC AGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I 
1281 AT GAT GACTGGT GCAGGCAAT AT CCT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 1340 

1141 T C CAGCAT GAG C GAGGT GC ACAC C GAT GAGC CT GAGGACTTTATT T C CAAGGT CT T CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1341 T C CAGCAT GAGC GAGGT GCACAC C GAT GAGC CT GAGGACT TT ATT T C CAAGGT CT T CT T T 1400 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 
1401 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1460 

1261 AAAGGGGGAGACAT GTCAAAGACCATGT ATGT GGACTACAAAACAGAGGAT GGTT CTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1461 AAAGGGGGAGACAT GTCAAAGACCATGT ATGT GGACTACAAAACAGAGGAT GGTT CTGCC 1520 

1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGC AC GGT GGT T C T GAAG C C AGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 
1521 AAT GCAGGGGCTGACTAT GAGTTCACAGAGGGCACGGT GGTTCT GAAGCCAGGAGAGACC 1580 

1381 CAGAAGGAGTT CT CCGTGGGCATAATT GATGACGACATTTTTGAGGAGGAT GAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I 
1581 CAGAAGGAGTT CT CCGTGGGCATAATT GAT GAC GACATTTTTGAGGAGGAT GAACACTTC 1640 

1441 T T T GTAAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGC AGCCAGAGGAGGGGAT GC CT C C A 1500 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1641 T TT GTAAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGC AGC CAGAGGAG GGGAT GC CT C C A 1700 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1701 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1760 



Qy 1561 GTTACCATCTT GGATGATGACCAT GCAGGCATCTTCACTTTT GAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1761 GTTACC AT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GT GAT ACT ATT CAT 1820 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1821 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1880 

Qy 1681 ACAGT CAT C GT CC C CT TT AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGTGAGGACTT T 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1881 ACAGT CAT C GT CC C CTTT AGGACAGT AGAAGGGAC AGC CAAGGGT GGCGGTGAGGACTT T 194 0 

Qy 1741 GAAGACACATAT GG GGAGT T GGAAT T CAAGAAT GATGAAACT GT GAAAAC C ATAAGGGT T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1941 GAAGACACATATGGGGAGTTGGAATTCAAGAATGAT GAAACT GT GAAAAC CAT AAGGGTT 2000 

Qy 1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT C TT CATT GC CCTT GGT GAA 1860 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2001 AAAAT AGT AGATGAGGAGGAAT AC GAAAGGCAAGAGAATTTCTT CATTGCCCTT GGT GAA 2060 

Qy 1861 CCGAAATGGATGGAACGT GGAAT AT C AGAT GT GACAGACAGGAAGCT GACTAT GGAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2061 C CGAAATGGAT GGAAC GT GGAAT AT C AGAT GT GACAGACAGGAAGCT GACTAT GGAAGAA 2120 

Qy 1921 GAGGAGGCCAAGAGGATAGCAGAGAT GGGAAAGC C AGTAT TGGGT GAAC ACC C CAAACT A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2121 GAGGAGGC CAAGAGGATAGCAGAGAT GGGAAAGC C AGT AT TGGGT GAAC ACC CCAAACT A 2180 

Qy 1981 GAAGT CAT CAT T GAAGAGT C CT AT GAGTT CAAGACT AC GGTGGACAAACT GAT CAAGAAG 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2181 GAAGT CAT CAT T GAAGAGT C CT AT GAGT T CAAGACT AC GGT GGACAAACT GAT CAAGAAG 224 0 

Qy 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2241 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2300 

Qy 2101 ACCGTCAGTGCAGCAGGGGATGAGGATGAGGATGAATCCGGGGAGGAGAGGCTGCCCTCC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2301 ACCGT CAGT GCAGCAGGGGAT GAGGAT GAGGATGAAT CCGGGGAGGAGAGGCTGCCCT CC 2360 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2361 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2420 

Qy 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2421 C CCC C CACAGAGTACT GC CACG GCT GGGCCT GCTTCGCCGTCTC CAT CCT CAT CATT GGC 2480 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2481 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2540 

Qy 2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



2541 



GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 



2600 



Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2601 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2660 

Qy 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 2661 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2720 

Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2721 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2780 

Qy 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2640 

II II I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I II 

Db 2781 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2840 

Qy 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2841 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2900 

Qy 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 901 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2 960 

Qy 2761 TTCTAA 2766 

I I I I I I 

Db 2961 TTCTAA 2966 



RESULT 5 
ABN83428 

ID ABN83428 standard; cDNA; 2782 BP. 
XX 

AC ABN83428; 
XX 

DT 21-AUG-2002 (first entry) 
XX 

DE Human transporter protein coding sequence. 
XX 

KW Human; sodium/ calcium exchanger; transporter; brain; heart; kidney; lung; 

KW spleen; testis; leukocyte; foetal brain; chromosome 14; gene; ss. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 
FT CDS 10. .2775 

FT /*tag= a 

FT /product= "Human transporter" 

XX 

PN WO200233086-A2. 
XX 

PD 25-APR-2002. 
XX 

PF 17-OCT-2001; 2001WO-US032152 . 
XX 



PR 17-OCT-2000; 2000US-0240836P . 

PR 13-MAR-2001; 2001US-00804474 . 
XX 

PA ( PEKE ) PE CORP NY. 
XX 

PI Merkulov GV, Ketchum KA, Shao W, Yan C, Di Francesco V; 

PI Beasley EM; 

XX 

DR WPI; 2002-479677/51. 

DR P-PSDB; ABB83246. 
XX 

PT Human transporter peptide related to sodium/ calcium exchanger subfamily 

PT for identifying modulators useful for treating a disease or condition 

PT mediated by human transporter protein. 
XX 

PS Claim 4; Fig 1; 200pp; English. 
XX 

CC The present sequence is the coding sequence of a human transporter 

CC protein, which is related to the sodium/ calcium exchanger subfamily. 

CC Experimental data indicates expression of the transporter gene in humans 

CC in brain, heart, kidney, lung, spleen, testis, leukocyte and foetal 

CC brain. The gene of the transporter was mapped to chromosome 14 by ePCR 

XX 

SQ Sequence 2782 BP; 655 A; 685 C; 766 G; 676 T; 0 U; 0 Other; 

Query Match 99.8%; Score 2761.2; DB 6; Length 2782; 
Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2763; Conservative 0; Mismatches 3; Indels 0; Gaps 0 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 



Qy 



Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 



Qy 



121 AC AGGGC AGAACAAT GAGT C CT GTT C AGGGT CAT C G GACT GC AAGGAGGGTGT C AT CCT G 180 




Db 



130 AC AGGGC AGAACAAT GAGT C CT GTT C AGGGT CAT C GGACT GCAAGGAGGGTGT CAT CCT G 189 



Qy 



Db 



181 C CAAT CT G GT AC C CGGAGAACC CTT C CCT T GGGGACAAGATT GC CAGGGT C ATT GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
190 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 249 



Qy 



Db 



241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 



Qy 



Db 



301 T CTATT GAAGTCAT CACCTCTCAAGAGAGGGAGGTGACAATT AAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
310 TCT ATT GAAGT CAT CACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 369 



Qy 

Db 



361 
370 



AC C AG C ACAAC CACT AT T CGGGT CT GGAAT GAAACT GT CT C C AACCT GAC CCTT AT GGC C 420 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AC CAGC ACAAC CACT AT T CGGGT CT GGAAT GAAACT GT CT C CAACCT GAC CCT TAT GGC C 429 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 489 

481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

490 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 549 

541 AT CAT T GGCAT CT GTGT CT ACGT GATCCCAGACGGAGAGACT C GCAAGAT CAAGCATCT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

550 AT CAT T GG CAT CT GTGT CTAC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGC AT CT A 609 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I III I II I I III I I III II I I I I III I II II lllllllili Mill II II I II I I I I I I I 

610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 669 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I II II I II I I I I I II I II I II I I II I II I I I II I I I I I II I II I II I II I II I I II I I I I 

670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 729 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I II II I II II II I I II I II II M I II I I II I II II I I I II II I I M II II I I I M I I II 

730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 789 

781 AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGTGAC 840 

I I I I I I I M I I M I I I I I II II I I I I I I I I I I I I I I II I II I I I II I M I I I I I I I I I M 

790 AT GC ACAAAAAGT ACC GC AC AGACAAACAC C GAGGAAT TAT C AT AGAGAC AGAGGGT GAC 849 

841 C ACC CTAAGGG CATT GAGAT GGAT GGGAAAAT GAT GAATT C C CATT TT CT AGAT GGGAAC 900 

I I I I I I I I I II I II II II I I I I I II I II I II I II I I I I I I I M I II I I I I I I II I I II I I 

850 C ACC CTAAGGGCATTGAGAT GGAT GGGAAAAT GAT GAATT C C CATT T T CT AGAT GG GAAC 909 

901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT CC GGATTCT C 960 

I I I I M II I I I I II I I I I M I I II I I I I I II II I I II I I II I I I I I I M I I I II II Ml 

910 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT C C GGAT CC T C 969 

961 AAGGAT CT GAAGCAAAAACACC C AGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I II I II I I II I II II I I I I I II I M I II II I I I I I II I I I I M I I I II I I II I II I I II 

970 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGTGGAGAT GGCCAAT 1029 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I II I II M II I M II I I I II II I I I II I I I M II M I II I II I II II I I I I I I I I I I I I 

1030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1089 

1081 AT GAT G ACT GGT GCAG GCAAT AT C CT GAAGAAACAT G C AGC AGAAC AAG C CAAGAAGG C C 1140 

I M I I I II I II I I II II M II II II I II I I I II I I II I M I M I I I I M I I I II II II M 

1090 AT GAT GACT GGT GCAGGCAATAT CCT GAAGAAACAT G C AGC AGAACAAGC CAAGAAGGC C 114 9 

1141 T C CAG CAT GAG C GAGGT GCACAC C GATGAGC CTGAGGACT T T AT TT C CAAGGT CTT CTTT 1200 

I M I I I I II I I M I I I II I II I I I I I II I I I I I I I I M I I I I II I II I I I I I I I I M I M 

1150 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1209 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I II M II I I I II I I II M II I I I II I I I I I I I I II M II I II I I I I II I I I II I M II I 

1210 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1269 



Qy 1261 AAAGGGG GAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAAC AGAGGAT GGT T CTGC C 1320 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1270 AAAGGGGGAGACATGTCAAAGACCATGTATGT GGACTACAAAACAGAGGATGGTTCT GCC 1329 

Qy 1321 AATGCAGGGGCTGACTAT GAGTT CACAGAGGGCACGGT GGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1330 AAT GC AGG GGCTGACTAT GAGTT CAC AGAGGG C AC GGT GGTT CT GAAGCCAGGAGAGAC C 1389 

Qy 1381 CAGAAGGAGT T CT C C GTG GGCATAAT T GAT GAC GAC ATT TTT GAGGAGGAT GAAC ACTT C 1440 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1390 CAGAAGGAGT T CT C CGTGGGC ATAAT T GAT GAC GACAT T T TT GAGGAGGAT GAACACTT C 1449 

Qy 1441 T TT GTAAGGT T GAG C AAT GT C CGC AT AGAGGAG GAGCAGC C AGAGGAGGGGAT G CCT C C A 1500 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1450 TTT GTAAGGTT GAGCAAT GT C CGC AT AGAGGAG GAGCAGC C AGAGGAGGGGAT GCCT C CA 1509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

Qy 1561 GTT AC CAT CTT GGAT GAT GAC CAT G CAGGC AT CT T CACTT TT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1570 GTTACCATCTT GGAT GATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATT CAT 1629 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1630 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1689 

Qy 1681 ACAGT CAT C GT CC C CT TT AGGAC AGT AGAAGGGAC AGCCAAGGGT GGCGGTGAGGACT TT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1690 ACAGT CAT C GT CC C CT TTAGGACAGT AGAAGGGAC AGCCAAGGGT GGC GGTGAGGACT T T 1749 

Qy 1741 GAAGACACATATGGGGAGTT GGAATT CAAGAAT GATGAAACT GTGAAAACCATAAGGGTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1750 GAAGAC AC AT AT G GG GAGTT GGAATT CAAGAAT GATGAAACT GT GAAAAC CATAAGGGT T 1809 

Qy 1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TTCT T C ATT GCC CTT GGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1810 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CT T CATT GCC CTT GGT GAA 1869 

Qy 1861 CCGAAATGGAT GGAACGT GGAATATCAGAT GTGACAGACAGGAAGCTGACTATGGAAGAA 1920 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1870 CCGAAATGGAT GGAACGT GGAATATCAGAT GTGACAGACAGGAAGCTGACTATGGAAGAA 1929 

Qy 1921 GAGGAGGC CAAGAGGATAGC AGAGAT GGGAAAGC C AGT ATT GGGT GAACAC CC CAAACT A 1980 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1930 GAGGAGGC CAAGAGGATAG C AGAGAT GGGAAAGC C AGT ATT GGGT GAACAC C C CAAACT G 1989 

Qy 1981 GAAGT CAT CAT T GAAGAGT C CT AT GAGT T CAAGACT ACG GT GGACAAACT GAT CAAGAAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1990 GAAGT CAT CATTGAAGAGT CCTAT GAGTT CAAGACTACGGTGGACAAACTGATCAAGAAG 2049 

Qy 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I 
Db 2050 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2109 

Qy 2101 ACC GT CAGT GCAGCAG GG GAT GAG GAT GAGGAT GAAT C C GGGGAGGAGAGGCT GC C CT C C 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2110 AC CGT CAGT GC AGC AGGGGATGAGGAT GAGGAT GAAT C CGGGGAGGAGAG GCTGCCCTCC 2169 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I 
Db 2170 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2229 

Qy 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2230 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2289 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2290 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2349 

Qy 2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2350 GATTCGGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 24 09 

Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I II I I I I I I I I I I I I 
Db 2410 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2469 

Qy 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2470 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2529 

Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2530 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2589 

Qy 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2590 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2649 

Qy 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2650 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2709 

Qy 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

I I I I I I I I I I I I U I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2710 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2769 

Qy 2761 TTCTAA 2766 

I I I I II 

Db 2770 TTCTAA 2775 
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Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 



Qy 121 AC AGGG C AGAACAAT GAGT C CTGTT C AGGGT CAT C GGACT GCAAGGAGGGTGT CAT C CT G 180 

I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 121 AC AGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT AT T GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T CT AT T GAAGT CAT C ACCT CT CAAGAGAGG GAGGT GACAATTAAGAAAC C CAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 AT T GCT GGT GATCT GGGAC CT T CT AC CAT T GT AGGGAGT GCAGC CTT CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

Qy 541 ATCATTGGCATCTGTGTCT ACGT GATCCCAGACGGAGAGACT CGCAAGATCAAGCAT CTA 600 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 AT CATTGGCATCTGTGTCT ACGT GAT CCCAGACGGAGAGACT CGCAAGATCAAGCAT CTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGTAC C GCACAGACAAACAC C GAGGAAT T ATCAT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 ATGCACAAAAAGTACCGCACAGACAAACAC CGAGGAATTATCATAGAGACAGAGGGT GAC 840 

Qy 841 CAC CCTAAGG GCATT GAGAT GGAT GGGAAAAT GAT GAATT CC CATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CAC C CTAAGGGCATT GAGAT G GAT GGGAAAAT GAT GAATT CC CATTT T CT AGAT G GGAAC 900 

Qy 901 CT G GT GCC CCT GGAAG GGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CT G GT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGATT CT C 960 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



961 AAGGAT CT GAAGCAAAAACAC C C AGAGAAGG ACTT AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I f I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCT GGTGGAGAT GGCCAAT 1020 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

1081 AT GATGACT GGTGCAGGCAATATC CTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I 1 
1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC ATGCAGC AGAAC AAGC CAAGAAGGCC 1140 

1141 T C CAGC AT GAGCGAGGT GCACACC GAT GAGC CT GAGGACTT T AT TT C CAAGGT CT T CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I III II I I II II I I II II Ml II II I III I II I I III 

1141 TCCAGCAT GAGCGAGGT GCACACC GAT GAGC CTGAGGACTTTATTTC CAAGGT CTT CTTT 1200 

1201 GAC CCAT GT T CTTAC CAGT GC CT G GAGAACT GT G GGG CT GT ACTC CT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GACCCATGTTCTTACCAGTGCCTG GAGAACT GTGGGGCTGTACTCCT GACAGT GGT GAGG 1260 



1261 



1261 



1321 



AAAGGGGGAGACATGTCAAAGACCATGTAT GT GGACT ACAAAACAGAGGAT GGTTCT GCC 1320 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT GCC 1320 



AAT GCAGGGGCTGACT AT GAGTT C AC AGAGGGC AC GGT GGT T CT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 AAT GCAGGGGCT GACT AT GAGT T CAC AGAGGGCAC GGT GGT T CT GAAGC CAGGAGAGACC 1380 

1381 CAGAAGGAGT T CT CC GT GGGCATAAT T GAT GAC GACATTTTT GAGGAGGATGAACACT T C 1440 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I II I I I 

1381 CAGAAGGAGT T CT C C GT GGGCATAATT GAT GAC GACATTTTT GAGGAGGATGAACACTT C 1440 

1441 TT T GTAAGGT T GAGCAAT GTC C GC AT AGAGGAGGAGC AGC C AGAG GAGG GGAT GC CT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TTTGTAAGGTT GAGCAAT GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCT CCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

II I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GTTACCATCTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GTGATACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 GTTACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTT CACTTTT GAAT GTGATACTATT CAT 1620 

1621 GT CAGT GAGAGT ATT GGT GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

1681 AC AGT CAT CGTCCCCTT T AG GACAGT AGAAGGGAC AGC CAAG GGT GGC GGT GAGGACT TT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

1741 GAAGAC ACAT AT GGGGAGTT GGAAT T CAAGAAT GATGAAACT GT GAAAAC CATAAGGGTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1741 GAAGACACATAT GGGGAGTTGGAATT CAAGAAT GATGAAACT GT GAAAAC CATAAGGGTT 1800 

1801 AAAAT AGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT C T T CAT T GC CCT T GGT GAA 1860 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 

Db 1801 AAAATAGT AGAT GAGGAGGAATAC GAAAG GCAAGAGAATTT CTT CATT GC C CT T G GT GAA 1860 

Qy 1861 C C GAAAT GGAT GGAACGT GGAAT AT C AGAT GT GACAGACAGGAAGCT GACT AT GGAAGAA 1920 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CCGAAAT GGAT GGAACGTGGAATATCAGATGTGACAGACAGGAAGCT GACTATGGAAGAA 1920 

Qy 1921 GAGGAGGC CAAGAG GAT AG CAGAGAT GGGAAAGCC AGT ATT GGGT GAACAC CC CAAACT A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 GAGGAGGC CAAGAG GATAGCAGAGAT GGGAAAGC C AGT AT T GGGT GAACAC CC CAAACT A 1980 

Qy 1981 GAAGT CAT CAT T GAAGAGT C CTAT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1981 GAAGT CAT CAT T GAAGAGT C CTAT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2040 

Qy 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

Qy 2101 ACCGTCAGT GCAGCAGGGGAT GAGGATGAGGATGAATCCGGGGAGGAGAGGCT GCCC 2157 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 ACC GT C AGT GC AGCAGC AGGGGAT GAGGAT GAGGAT GAAT C C GGGGAGGAGAGGCT GCCC 2160 

Qy 2158 TCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGT 2217 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2161 TCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGT 2220 

Qy 2218 GTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCT CAT CATT 2277 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 GTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATT 2280 

Qy 2278 GGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTC 2337 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTC 2340 

Qy 2338 AAAGAT T CAGTCACAGCT GT T GT T TT C GT GGCATT T GGCAC CTCT GT CC CAGAT ACGTTT 2397 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AAAGATT CAGTCACAGCT GTT GT T T T C GT G GCAT T T GGCAC CTCT GT CC CAGAT ACGTTT 2400 

Qy 2398 GCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACG 2457 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I 
Db 2401 GC C AGCAAAGCT G CT GC C CT CCAG GAT GT AT AT GCAGAC GC CTC CAT T GG CAAC GT GACG 2460 

Qy 2458 GGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATC 2517 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 GGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATC 252 0 

Qy 2518 TACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTC 2577 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 TACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTC 2580 

Qy 2578 ACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCG 2637 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 ACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCG 2640 



Qy 2638 CACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTT 2697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I H I I I I I I I 



Db 2641 CACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTT 2700 

Qy 2698 GTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAG 2757 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I 
Db 2701 GTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAG 2760 

Qy 2758 GGGTTCTAA 2766 

MINIMI 
Db 2761 GGGTTCTAA 2769 
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XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium-calcium exchanger 



CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence represents a mutant form of a NHIEP of the invention. Note: The 

CC present sequence is not shown in the specification but is derived from 

CC the human NHIEP sequence shown as SEQ ID 1 (ABQ78861) 
XX 

SQ Sequence 2769 BP; 655 A; 679 C; 762 G; 673 T; 0 U; 0 Other; 

Query Match 99.5%; Score 2751.4; DB 6; Length 2769; 

Best Local Similarity 99.9%; Pred. No. 0; 
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Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAAT GAGTCCT GTT CAGGGT CAT CGGACT GCAAGGAGGGTGT CATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAAT GAGTCCT GTT CAGGGT CATCGGACT GCAAGGAGGGTGT CATCCTG 180 

Qy 181 C CAAT CT GGT ACC C G GAGAAC C CT T C C CTT GGGGACAAGAT T GCC AGGGT CAT T GT CT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT AT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 T CT AT T GAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAA 360 

Qy 361 AC C AGCACAAC CACT ATT CGGGT CT GGAAT GAAACT GT CT CCAAC CT GAC CCT TAT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 4 81 AT T G C T GGT GATCT GGGAC CT T CTAC CAT T GT AGGGAGT GCAGCCT T C AACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I f I 
Db 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

Qy 541 AT CATTGGCATCTGT GT CTACGT GAT CCCAGACGGAGAGACT CGCAAGATCAAGCAT CTA 600 

I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 ATCATTGGCAT CTGT GTCTACGT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCATCTA 600 



Qy 



601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 



1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GC ACAAAAAGTACCGCAC AGACAAAC AC C GAGGAATTAT C AT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 81 AT GCACAAAAAGTACC GCAC AGACAAAC AC C GAGGAATTAT CAT AGAGAC AGAGGGT GAC 840" 

Qy 841 CACCCTAAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAATT CC CATT T T CT AGAT GGGAAC 900 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATT CCCATTTTCTAGAT GGGAAC 900 

Qy 901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GATCC GGAT TCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 901 CT GGTGCC CCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CC GGATTCT C 960 

Qy 961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 961 AAGGAT CT GAAGCAAAAAC ACC CAGAGAAGGACTT AGATC AGCT GGT GGAGAT GGC CAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACTGGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 ATGAT GACTGGTGCAGGCAATATCCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGC C 1140 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1141 T CCAGCAT GAGC GAGGT GCACACC GATGAGC CTGAGGACTT T ATTT CCAAGGT CT T CTTT 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGATGGT T CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I 
Db 1261 AAAGG GG GAGAC AT GT CAAAGAC CAT GT AT GT GGACT AC AAAACAGAGGATGGT T CT GC C 1320 

Qy 1321 AAT GC AGGGGCT GACT AT GAGT T C ACAGAGGGC AC G GT GGT T CT GAAGC CAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GC AG GGG CT GACT AT GAGT T C ACAGAGGGCACGGT GGT T CT GAAGCCAGGAGAGAC C 1380 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGT T CT CCGT G GGCATAAT T GAT GACGACAT TTT T GAGGAGGATGAAC ACT T C 1440 

Qy 1441 T T TGTAAGGT T GAGCAAT GT CC GCAT AGAGGAGGAG C AGC CAGAGGAGGGGAT GC CTC CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1441 T TT GT AAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGC AGCCAGAGGAGGGGAT GC CT C CA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTTACCATCTTGGATGATGACCATGCAGGCATCTTCACTTTTGAATGTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTACCATCTT GGATGATGACCAT GCAGGCATCTT CACTTTTGAATGT GATACT ATTCAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

Qy 1741 GAAGACACAT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACTGT GAAAACC ATAAGGGT T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 GAAGACACAT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACTGT GAAAACC ATAAGGGTT 1800 

Qy 1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CT T CAT T G C C CTT GGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAATTT CT T CAT T G C C CTT GGT GAA 1860 

Qy 1861 C C GAAAT GGAT GGAAC GT G GAAT AT C AGAT GT GACAGACAGGAAGCT GACT AT GGAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 C CGAAAT GGAT GGAAC GT GGAAT AT C AGGT GT GACAGACAGGAAGCT GACT AT GGAAGAA 1920 

Qy 1921 GAGGAGGCCAAGAGGATAGCAGAGATGGGAAAGCCAGTATTGGGTGAACACCCCAAACTA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 GAGGAGGC CAAGAGGATAGC AGAGAT G G GAAAGC C AGT ATT GGGT GAACAC C C CAAACT A 1980 

Qy 1981 GAAGT CAT CAT T GAAGAGT C CT AT GAGT T CAAGACT ACGGT GGACAAACT GAT CAAGAAG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GAAGTCATCATTGAAGAGTCCTAT GAGTT CAAGACT ACGGTGGACAAACT GAT CAAGAAG 2040 

Qy 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

Qy 2101 ACCGTCAGT GC AGCAGGGGAT GAGGAT GAGGAT GAATCCGGGGAGGAGAG G CT GCC C 2157 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AC C GTCAGTGCAGC AGCAGGGGAT GAGGAT GAGGAT GAAT CC GG GGAGGAGAGGCT G CC C 2160 

Qy 2158 TCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGT 2217 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I 
Db 2161 TCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGT 2220 

Qy 2218 GTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATT 2277 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATT 2280 

Qy 2278 GGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTC 2337 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTC 2340 



Qy 

Db 



2338 
2341 



AAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTT 2397 
I I I I I I I I I I I I i I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTT 24 00 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2398 GCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACG 2457 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2401 GCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACG 2460 

2458 GGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATC 2517 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 GGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATC 2520 

2S18 TACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTC 2577 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 TACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTC 2580 

2578 ACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCG 2637 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 ACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCG 2640 

2638 CACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTT 2697 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 CACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTT 2700 

2698 GTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAG 2757 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 GTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAG 2760 

2758 GGGTTCTAA 2766 

I I I I I I I I I 
2761 GGGTTCTAA 2769 



RESULT 8 
ABA04756 

ID ABA04756 standard; cDNA; 2781 BP. 
XX 

AC ABA04756; 
XX 

DT 25-FEB-2002 (first entry) 
XX 

DE Human natrium(+) -calcium (2+) exchanger form 3 protein, HNCX3, cDNA. 
XX 

KW Human; Natrium (+) -Calcium (2+) exchanger form 3; HNCX3; chromosome 14; 

KW cardiac failure; myocardial infarction; cardiac hypertrophy; arrhythmia; 

KW myocarditis; pulmonary hypertension; cardiotoxicity ; cardiant; Vaccine; 

KW coronary heart disease; renal failure; ischaemic disorder; 

KW Antiarrhythmic; Vasotropic; Hypotensive; cardiovascular disorder; ss. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 
FT CDS 1. .2781 

FT /*tag= a 

FT /partial 

FT /product= "Human natrium (+) -calcium (2+) exchanger form 3 



FT protein, HNCX3" 

FT /note= "No stop codon given" 

XX 

PN WO200183744-A2. 
XX 

PD 08-NOV-2001. 



XX 

PF 30-APR-2001; 2001WO-EP004886 . 
XX 

PR 02-MAY-2000; 2000EP-00109080 . 
XX 

PA (MERE ) MERCK PATENT GMBH. 
XX 

PI Wilm C; 
XX 

DR WPI; 2002-041493/05. 

DR P-PSDB; AAM47745. 
XX 

PT New polypeptide, useful as vaccines for inducing immune response against 



PT diseases such as myocardial infarction, arrhythmia, ischemic disorders, 

PT renal disorders in mammal. 

XX 

PS Claim 4; Page 34-38; 41pp; English. 
XX 

CC The present sequence is the coding sequence for human Natrium ( + ) -Calcium 

CC (2+) exchanger form 3 (HNCX3) . The HNCX3 gene maps to human chromosome 

CC 14. HNCX3 and its coding sequence are useful for treating acute and 

CC chronic cardiac failure of different aetiologies, myocardial infarction, 

CC cardiac hypertrophy, arrhythmia, myocarditis, pulmonary hypertension, 

CC cardiotoxicity (e.g. induced by chemotherapy), coronary heart disease, 

CC acute and chronic renal failure, ischaemic disorders of skeletal muscle 

CC and ischaemic brain disorders of different aetiologies 
XX 

SQ Sequence 2781 BP; 658 A; 678 C; 765 G; 680 T; 0 U; 0 Other; 



Query Match 98.8%; Score 2733.4; DB 6; Length 2781; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 2762; Conservative 0; Mismatches 1; Indels 18; Gaps 1 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

II I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I II I I I I II II I I I I I I I I I I I I I I I 

Db 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 



Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATT AAGAAAC C CAAT G GAGAA 360 

I II I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T CTATT GAAGT CAT CAC CT CTCAAGAGAGGGAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

Qy 361 AC CAGCACAAC CACTATT CGGGT CT GGAAT GAAACT GT CT C CAACCT GAC CCT TAT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AC CAGCACAAC CAC TAT T CGGGT CT GGAAT GAAACT GT CT C CAACCT GAC CCTTAT GGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 ATTGCT GGTGAT CT GGGAC CTT CT AC CATT GT AGGGAGT GCAGC CT T CAACAT GTT CAT C 540 

Qy 541 ATCATTGGCATCT GTGTCTACGT GAT CCCAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 ATCATTGGCAT CT GTGTCTACGT GAT CCCAGACGGAGAGACT CGCAAGAT CAAGCATCTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 C GAGT CTT CTT CAT CAC C GCT GCTT GGAGT AT CT TT GC CT AC AT CT G GCT CT AT AT GAT T 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGT AC C GC ACAGACAAAC AC C GAGGAAT TAT CAT AGAGACAGAGGGTGAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AT GCACAAAAAGT ACCGC ACAGACAAAC AC C GAGGAAT TAT CAT AGAGACAGAGGGTGAC 840 

Qy 841 CACC CT AAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT C C CATT T T CT AGAT GG GAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CACC CT AAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATT C C CATT T T CT AGAT GG GAAC 900 

Qy 901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT C C C G CAGAGAGAT GAT CC GGATTCT C 960 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I 

Db 901 CT GGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GATCCGGATTCT C 960 

Qy 961 AAGGAT CT GAAGCAAAAACACCC AGAGAAGGACT T AGAT C AGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGAT CT GAAGCAAAAACACC C AGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGCCAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACT G GT GCAGGCAAT AT CCT GAAGAAAC AT GCAGC AGAACAAGCCAAGAAGGC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1081 AT GAT GACT GGT G CAGG CAATAT CCT GAAGAAAC AT GCAGC AGAACAAGC CAAGAAGGC C 1140 



Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



1141 T C CAGC AT GAGCGAGGT GCACAC CGATGAGC CT GAGGACT T T ATTT C CAAGGT CTT CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

1261 AAAGGGGGAGACAT GTCAAAGACCATGTAT GTGGACTACAAAACAGAGGATGGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1261 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAGGAT GGTT CT GCC 1320 

1321 AAT GCAGGGGCT GACT AT GAGTT C ACAGAGGGCAC GGT GGTT CT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGT GGT T CT GAAGC CAGGAGAGACC 1380 

1381 C AGAAGGAGT T CT C CGT GGGC ATAATT GAT GACGACAT T T TT GAGGAGGAT GAACACT TC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CAGAAGGAGTT CT CCGT GGGCATAATT GAT GACGACAT TTTT GAGGAGGATGAACACTTC 1440 

1441 T TT GTAAGGT T GAGCAAT GT CC GCAT AGAGGAGGAGCAGC C AGAGGAGGGGAT GCCT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 T T T GTAAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGCAGC C AGAGGAGGGGAT GC CT C CA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GT T ACC AT CT T GGAT GAT GAC CAT GC AGGCAT CTT C ACT T T T GAAT GT GAT ACT AT T CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GT T ACC AT CT T GGAT GAT GAC CAT GC AGGCAT CT T CACT TT T GAAT GT GAT ACT AT T CAT 1620 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GT CAGT GAGAGT AT T GGT GTT AT GGAGGT CAAGGT T CT GC GGACAT C AGGTGCC C GGGGT 1680 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

1741 GAAGAC ACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAAC CATAAGGGTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GAAGAC ACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAAC CAT AAG GGTT 1800 

1801 AAAATAGT AGAT GAGGAGGAAT AC GAAAGGC AAGAGAAT T T CTT CAT TGCCCTTGGT GAA 1860 

I I I I I I I I I I I I I I I I I I I II I I I II ) I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 AAAATAGT AGAT GAGGAG GAAT AC GAAAGGCAAGAGAAT T T CTT CAT T GC CCT T GGT GAA 1860 



1861 C C GAAAT GGAT GGAAC GT GGAAT AT C AGAT GTG AC AG AC AG G 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 CCGAAAT GGATGGAACGT GGAATATCAGGTGT GAGATT CTTTAAAGAT GTGACAGACAGG 



1902 



1920 



1962 



1903 AAGCT GACT AT GGAAGAAGAGGAGGC CAAGAGGATAGCAGAGATGGGAAAGC CAGT ATT G 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 AAGCT GACT AT GGAAGAAG AGGAGGCCAAGAGGAT AG CAGAGAT GGGAAAGC CAGT ATT G 1980 



Qy 1963 GGT GAACACCCCAAACTAGAAGT CATCATT GAAGAGTCCT ATGAGTTCAAGACTACGGTG 2022 

I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1981 GGT GAACACCCCAAACTAGAAGT CAT CATT GAAGAGTCCT ATGAGTTCAAGACTACGGTG 2040 

Qy 2023 GACAAACT GAT CAAGAAGACAAACCTGGCCTT GGT TGTGGGGACC CATT CCTGGAGGGAC 2082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2041 GACAAACTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGAC 2100 

Qy 2083 CAGTT CAT GGAGGCC AT CAC C GT CAGT GCAGCAGGGGAT GAGGAT GAGGAT GAAT C C GGG 2142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CAGTT CAT GGAGG C CAT C ACC GT CAGT GCAGCAGGGGAT GAGGAT GAGGAT GAAT C C G GG 2160 

Qy 2143 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 2202 

I I I I I I II MINIM II III II MM I I I I I I II II I I I I II I I III II I I II II I I I I 

Db 2161 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 2220 

Qy 2203 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 2262 

II I II II I II II I II I II II II I II II I I I I M II II I II II M II II I I II M I I II II 

Db 2221 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 2280 

Qy 2263 TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 2322 

I II I I I II II II I I II II I II II II I II I I II I I I II I I I II I II I II I II II II I II II 
Db 2281 TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 234 0 

Qy 2323 TGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCT 2382 

I II II II I II I I I I II I I I I I I I II II I I I I I I I II I I I II I II I I II II I II I I I I I I I 
Db 2341 T GCAC CAT T GGT CT CAAAGAT T CAGT CACAGCT GT T GTT T T C GT G GCATTT GGCAC CT CT 2400 

Qy 2383 GT C CC AGATACGT TT GC C AG CAAAG CTGCT GCC CT C C AGGAT GTAT AT GC AGAC GC CT CC 2442 

I II II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I II 

Db 2401 GT C CCAGATACGT TT GC CAGCAAAG CTGCT GCC CT C CAGGAT GTAT AT GC AGAC G C CT CC 24 60 

Qy 2443 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 2502 

II I I I II I I I II I I II II I I I II II I I I I I I I I I I I I II I I II I I I I II II I II I I II II 

Db 24 61 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 2520 

Qy 2503 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 2562 

II I I I I II II I II I II II I I I I I II I I I II I I I I I I I I II I I II I II II I I II II I I I I I 
Db 2521 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 2580 

Qy 2563 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 2622 

I II I I I I I I I I M I I I II I I I II II I II II I II I I I I I II I I I I I I I I II I I I II I II I I 
Db 2581 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 2640 

Qy 2623 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 2682 

I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I II II II II 
Db 2641 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 2700 

Qy 2683 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 2742 

I I I I II II I I I II II II I II M I II II I I I II I I I I I I II I I I I II I I II I II I I I II I I 

Db 2701 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 2760 

Qy 2743 TATTGCTACATCAAGGGGTTC 2763 

II I II I I I II I I II I I II II I 

Db 2761 TATTGCTACATCAAGGGGTTC 2781 
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PI Malyankar UM, Patturajan M, Miller CE, Taupier RJ, Heyes MP, Ju J; 

PI Peyman JA, Catterton E, Macdougall JR, Edinger SR, Stone DJ; 

PI Mazur A; 
XX 

DR WPI; 2003-046862/04. 

DR P-PSDB; ABU12043. 
XX 

PT New isolated NOVX polypeptide useful for treating cardiomyopathy, 

PT atherosclerosis, metabolic disorders, diabetes, obesity, infectious 

PT disease, anorexia, neurodegenerative disorders, Alzheimer's disease and 

PT cancer. 

XX 

PS Claim 3; Page 85-86; 425pp; English. 
XX 

CC This invention describes novel polypeptides, termed NOVX which have 

CC antidiabetic, antiarteriosclerotic, anorectic, metabolic, antimicrobial, 

CC neuroprotective, antiparkinsonian, antilipaemic, cytostatic, nootropic, 

CC cardiant and immunomodulatory activity. The polypeptide and any 

CC antibodies generated from it are useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease 

CC selected from a pathology associated with the NOVX polypeptide. Fragments 

CC and portions of the polynucleotides encoding NOVX polypeptides are useful 

CC to map the location of NOVX genes on a chromosome, to identify 

CC individuals from minute biological samples, as DNA markers for 

CC restriction fragment length polymorphism (RFLP) , and are useful to 

CC prepare polymerase chain reaction primers. The products of the invention 

CC can be used in gene therapy and for treating cardiomyopathy, metabolic 

CC disorders, diabetes, atherosclerosis, obesity, infectious disease, 

CC anorexia, neurodegenerative disorders, Alzheimer's disease, Parkinson's 

CC disease, immune disorders, haematopoietic disorders, and various 

CC dyslipidaemias, metabolic disturbances associated with obesity, metabolic 

CC syndrome X and wasting disorders associated with chronic diseases and 

CC various cancers. ABX56261-ABX56306 represent the polynucleotide fragments 

CC which encode the NOVX polypeptides represented in ABU12041-ABU12086 

XX 

SQ Sequence 2685 BP; 645 A; 657 C; 741 G; 642 T; 0 U; 0 Other; 



Query Match 96.6%; Score 2673.2; DB 7; Length 2685; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2675; Conservative 0; Mismatches 3; Indels 0; Gaps 0 

Qy 86 GAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGCACAGGGCAGAACAATGAGTCCTGTT 145 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 GAT CCGAGGCT GGTGGCT CAGGGGACGTGCCAAGCACAGGGCAGAACAAT GAGTCCT GTT 61 

Qy 14 6 CAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTT 205 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62 CAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTT 121 

Qy 206 CCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCC 265 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 122 CCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCC 181 



Qy 266 TTGGGGTGTCCATCATTGCTGACCGCTTCATGGCATCTATTGAAGTCATCACCTCTCAAG 325 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 182 TTGGGGTGTCCATCATTGCTGACCGCTTCATGGCATCTATTGAAGTCATCACCTCTCAAG 241 



326 AGAGGGAGGT GACAAT TAAGAAAC C CAAT GGAGAAAC C AGC ACAAC CACT AT T C GGGT CT 385 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
242 AGAGGGAGGT GACAATT AAGAAAC CCAAT GGAGAAAC CAGC ACAAC CACTAT TCGG GT CT 301 

386 GGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATAC 445 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
302 GGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATAC 361 

446 TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
362 TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 421 

506 C CATT GT AGGGAGT GCAGC CT T CAACAT GTT C AT CAT C ATT GGCAT CT GT GT CT ACGT GA 565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I It 11 It I I II II It I I I I I I I II II 

422 C CATT GT AGGGAGT GCAGC CT T CAACAT GT T CAT CAT CAT T GGC AT CT GT GT CT AC GT GA 481 

566 T C CCAGAC GGAGAGACT C GCAAGAT CAAGCAT CT ACGAGTCTT CT T CAT CACCGCT GCT T 625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
482 T C C C AGAC G GAGAGACT C G CAAGAT CAAACAT CT AC GAGT CTT CT T CAT CAC CGCT GCT T 541 

626 GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I 
542 GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 601 

686 TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 745 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
602 TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 661 

746 GGGT GG C AGAT AAAC GACT GCTCTT CT ACAAAT ACAT G C ACAAAAAGT ACC GCACAGAC A 805 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

662 GGGT GGC AGAT AAAC GACT GCT CTT CT ACAAAT ACAT GCACAAAAAGT AC C GCACAGACA 721 

8 06 AACACCGAGGAATTATCATAGAGACAGAGGGTGACCACCCTAAGGGCATT GAGAT GGATG 865 

I I I I I I I I I I I I I I I I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
722 AACACCGAGGAATTATCATAGAGACAGAGGGT GACCACCCTAAGGGCATT GAGAT GGATG 781 

866 GGAAAATGATGAATTCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAGGAAG 925 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
782 GGAAAAT GAT GAATT CCCATTTT CT AGAT G GGAAC CT GGT GC C CCT GGAAGGGAAGGAAG 841 

926 T GGAT GAGTCCCGCAGAGAGATGAT CCGGATT CTCAAGGATCTGAAGCAAAAACACCCAG 985 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
842 T GGAT GAGT CC C GC AGAGAGAT GAT CC GGATT CT CAAGGAT CT GAAG CAAAAAC AC C CAG 901 

986 AGAAG GACT T AGAT C AGCT GGTGGAGAT GGC CAATTACT AT GCTCT T T C C CAC CAAC AGA 1045 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II II I I I I I I I I I I II I I 
902 AGAAGGACTTAGATCAGCTGGTGGAGAT GGCCAATTACTATGCTCTTT C CCACCAACAGA 961 

1046 AGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAATATCC 1105 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
962 AGAGC C GCGC CT TCT ACC GT AT C CAAGC CACT C GT AT GAT GACT GGT GCAGGCAAT AT C C 1021 

1106 TGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT CCAGCATGAGCGAGGT GCACACCG 1165 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1022 T GAAGAAAC AT GCAG CAGAACAAGCCAAGAAGGC CT C C AGCAT GAG C GAGGT GC AC AC C G 1081 

1166 ATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGG 1225 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 

Db 1082 ATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGG 1141 

Qy 1226 AGAACT GT GGGGCT GTACT C CT GAC AGT GGT GAGGAAAGGGGGAGACAT GT CAAAGACCA 12 85 

II I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1142 AGAACT GT GGGGCT GTACT C CT GAC AGT GGT GAGGAAAGGGGGAGACAT GT CAAAGAC CA 1201 

Qy 1286 T GT ATGT GGACTACAAAACAGAGGAT GGT T CTGC CAAT GCAGG GGCT GAC TAT GAGTT CA 1345 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1202 T GT AT GT GGACTACAAAACAGAGGAT GGT T CTGC CAAT G CAGGGGCT GACT AT GAGTT CA 1261 

Qy 1346 C AGAGGGCAC G GT GGTT CT GAAGCCAGGAGAGAC C C AGAAGGAGTT CTC CGT GGGC AT AA 1405 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1262 C AGAGGGCAC GGT GGTT CT GAAGC CAGGAGAGAC C CAGAAGGAGTT CTC C GT GGGC AT AA 1321 

Qy 1406 T T GAT GAC GACAT T T TT GAGGAGGAT GAAC ACT T CT TT GTAAGGTT GAGCAAT GT C C GCA 14 65 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1322 T T GAT GAC GACAT T TTT GAGGAGGAT GAAC ACT T CTTT GTAAGGTT GAGCAAT GT CC GC A 1381 

Qy 1466 T AGAGGAGGAGCAG CCAGAGGAGGGGAT GC CT C C AG CAAT AT T CAAC AGT CTT CC CTT GC 1525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1382 T AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CTCCAG CAAT ATT CAAC AGT CTT C CCTT GC 14 41 

Qy 1526 CTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATG 1585 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1442 CTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATG 1501 

Qy 1586 C AGGCAT CT T CACT T TT GAAT GT GAT ACT ATTC AT GTC AGT GAGAGTAT T GGT GT T AT GG 1645 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1502 C AGGCAT CT T CACT T TT GAAT GT GAT ACT ATTC AT GTC AGT GAGAGTAT T GGT GT TAT GG 1561 

Qy 1646 AGGT CAAGGT T CT G C GGACAT CAGGT GC C C GGGGT ACAGT CATC GT CCC CT TT AGGACAG 1705 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1562 AGGT CAAGGT T CTGC GGACAT CAGGT GCCCGGGGTACAGT CAT CGT CCC CTTT AGGACAG 1621 

Qy 1706 T AGAAGGGACAGCCAAGGGTGGCGGT GAGGACTTT GAAGACACATATGGGGAGTTGGAAT 1765 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1622 TAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT GAAGACACATATGGGGAGTTGGAAT 1681 

Qy 1766 T CAAGAATGAT GAAACT GT GAAAACCATAAGGGTTAAAATAGTAGAT GAGGAGGAATACG 1825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1682 T CAAGAAT GAT GAAACT GT GAAAACCAT AAGGGT T AAAAT AGT AGAT GAGGAGGAATACG 1741 

Qy 1826 AAAGGCAAGAGAATTT CT T CATT G CCCTT GGT GAAC C GAAAT GGAT GGAAC GT GGAAT AT 1885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1742 AAAGGCAAGAGAATTT CT T CATT GC C CTT G GT GAAC C GAAAT GGAT GGAAC GT G GAAT AT 1801 

Qy 1886 C AGAT GT GACAGACAGGAAGCT GACT AT GGAAGAAGAGGAGG CCAAGAGGAT AG CAGAGA 1945 

I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1802 CAGATGT GACAGACAGGAAGCT GACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1861 

Qy 1946 T GGGAAAGC CAGTATT GG GT GAAC AC CC CAAACT AGAAGT CAT CATT GAAGAGT C CT AT G 2005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1862 T GGGAAAGC CAGTATT GGGT GAACACC C CAAACT AGAAGT CAT CATT GAAGAGT CCT AT G 1921 



Qy 2006 AGTTCAAGACTAC GGT GGACAAACT GAT CAAGAAGACAAACCTGGCCTT GGTT GTGGGGA 2065 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 



Db 1922 AGT T CAAGACT ACGGT GGACAAACT GAT CAAGAAGACAAACCT GG CCTT GGT T GT GGGGA 1981 

Qy 2066 CCCATT CCT GGAGGGACCAGTTCAT GGAGGCCATCACCGTCAGT GCAGCAGGGGATGAGG 2125 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1982 CC CAT T CCT GGAGGGAC CAGTT CAT G GAGGCC AT CAC C GT CAGT GC AGC AGGGGAT GAGG 2041 

Qy 2126 ATGAGGATGAATCCGGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCC 2185 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2042 ATGAGGATGAATCCGGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCC 2101 

Qy 2186 TGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCT 2245 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2102 TGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCT 2161 

Qy 2246 GGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACC 2305 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2162 GGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACC 2221 

Qy 2306 TGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCG 2365 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2222 TGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCG 2281 

Qy 2366 TGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATG 2425 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2282 TGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATG 2341 

Qy 2426 TATATGCAGACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGG 24 85 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2342 TAT AT GCAGAC GC CT C CATT GGCAACGT GAC GGGC AGCAACGC C GT CAAT GT CTT C CT GG 2401 

Qy 2486 GCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCC 2545 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2402 GCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCC 2461 

Qy 2546 ACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCT 2605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 62 ACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCT 2521 

Qy 2606 GCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCC 2665 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2522 GCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCC 2581 

Qy 2666 GTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCT 2725 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2582 GTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCT 2641 

Qy 2726 TT GC CACAC T AGAGGC CT ATTGCT ACAT CAAGGGGT T C 2763 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2642 TTGCCACACTAGAGGCCTATTGCTACATCAAGGGGTTC 2679 
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XX 
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XX 

DE Human NOVlb CG56558-02 DNA SEQ ID 3. 
XX 

KW NOVX; human; antidiabetic; antiarteriosclerotic; anorectic; nootropic; 

KW metabolic; antimicrobial; neuroprotective; antiparkinsonian; cardiant; 

KW antilipaemic; cytostatic; immunomodulatory; gene therapy; dyslipidaemia; 

KW cardiomyopathy; metabolic disorder; diabetes; atherosclerosis; obesity; 

KW anorexia; neurodegenerative disorder; Alzheimer f s disease; cancer; gene; 

KW Parkinson's disease; haematopoietic disorder; metabolic disturbance; 

KW metabolic syndrome X; wasting disease; ds . 
XX 
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XX 

PT New isolated NOVX polypeptide useful for treating cardiomyopathy, 

PT atherosclerosis , metabolic disorders, diabetes, obesity, infectious 

PT disease, anorexia, neurodegenerative disorders , Alzheimer's disease and 

PT cancer. 

XX 

PS Claim 3; Page 84; 425pp; English. 
XX 

CC This invention describes novel polypeptides, termed NOVX which have 

CC antidiabetic, antiarteriosclerotic, anorectic, metabolic, antimicrobial, 

CC neuroprotective, antiparkinsonian, antilipaemic, cytostatic, nootropic, 

CC cardiant and immunomodulatory activity. The polypeptide and any 

CC antibodies generated from it are useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease 

CC selected from a pathology associated with the NOVX polypeptide. Fragments 

CC and portions of the polynucleotides encoding NOVX polypeptides are useful 

CC to map the location of NOVX genes on a chromosome, to identify 

CC individuals from minute biological samples, as DNA markers for 

CC restriction fragment length polymorphism (RFLP) , and are useful to 

CC prepare polymerase chain reaction primers. The products of the invention 

CC can be used in gene therapy and for treating cardiomyopathy, metabolic 

CC disorders, diabetes, atherosclerosis, obesity, infectious disease, 

CC anorexia, neurodegenerative disorders, Alzheimer's disease, Parkinson's 

CC disease, immune disorders, haematopoietic disorders, and various 

CC dyslipidaemias, metabolic disturbances associated with obesity, metabolic 

CC syndrome X and wasting disorders associated with chronic diseases and 

CC various cancers. ABX56261-ABX56306 represent the polynucleotide fragments 

CC which encode the NOVX polypeptides represented in ABU12041-ABU12086 

XX 

SQ Sequence 2840 BP; 668 A; 700 C; 775 G; 697 T; 0 U; 0 Other; 



Query Match 96.1%; Score 2657.6; DB 7; Length 2840; 

Best Local Similarity 97.6%; Pred. No. 0; 

Matches 2712; Conservative 0; Mismatches 54; Indels 12; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 63 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 122 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 123 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 182 

Qy 121 AC AGGGCAGAACAAT GAGT CCT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 183 AC AGG GC AGAACAAT GAGT C CT GTT CAGGGT CAT C G GACT GCAAGGAGGGT GT CAT C CT G 242 

Qy 181 CCAAT CT GGT ACC C GGAGAACCCTT C CCT T GGGGACAAGAT T GC CAGGGT CAT T GT CTAT 24 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 243 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 302 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 303 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 362 

Qy 301 TCTATT GAAGTCAT CACCTCT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



Db 363 T CT ATT GAAGT CAT CAC CT CTCAAGAGAGGGAGGT GACAATTAAGAAAC C CAAT GGAGAA 422 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

II I I I II I I I I I I I II I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 
Db 423 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 482 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I I 
Db 483 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 543 AT T GCT GGT GAT CT GGGACCTT CT ACC AT T GT AGGGAGT GCAGC CTT CAACAT GTT C AT C 602 

Qy 541 AT CATT GGCATCTGTGTCTACGT GATCCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 603 AT CATTGGCATCTGTGT CTACGT GATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 662 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 663 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 722 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 783 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 842 

Qy 781 ATGCACAAAAAGT AC C GCACAGACAAAC AC CGAGGAATT AT C AT AGAGAC AGAGGGT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 843 AT GCACAAAAAGT AC C GCACAGACAAAC AC CGAGGAATT AT CAT AGAGAC AGAGG GT GAC 902 

Qy 841 CAC C CTAAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAAT T CC C AT T T TCT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 903 CAC C CT AAGGGCATT GAGAT GGAT GGGAAAAT GAT GAAT T CC C AT T T TCT AGAT GG GAAC 962 

Qy 901 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C C G CAGAGAGAT GAT C C GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 963 CT GGT GCCC CT GGAAGGGAAGGAAGT GGAT GAGT CC C G CAGAGAGAT GAT CC GGAT T CT C 1022 

Qy 961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1023 AAGGAT CT GAAGCAAAAACAC C C AGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1082 

Qy 1021 TACT AT GCT CT T T CC CAC CAACAGAAGAGC C GC GC CT T CT AC C GT AT C CAAGC CACT C GT 1080 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1083 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1142 

Qy 1081 AT GAT GACT GGTGCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1143 ATGAT GACT GGTGCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1202 

Qy 1141 TCC AGC AT GAGCGAGGT GCACACC GAT GAG CCT GAGGACTTTATTT C CAAGGT CTT CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1203 T C C AGCAT GAG C GAGGT GCACACC GAT GAG CCT GAGGACTTT AT TT C CAAGGT CTT CT T T 1262 



Qy 

Db 



1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1263 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1322 



Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CATGT AT GT GGACT ACAAAACAGAG GAT GGT T CTGC C 1320 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1323 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGTTCTGCC 1382 

Qy 1321 AAT GC AGG GGCT GACT AT GAGTT C ACAGAGG GCACGGT GGT T CT GAAGC C AG GAGAGAC C 1380 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1383 AAT GCAGGGGCT GACT AT GAGTT CACAGAGGGCACGGTGGTT CTGAAGCCAGGAGAGACC 1442 

Qy 1381 C AGAAGGAGT T CT C C GT GGGC ATAATT GATGAC GACAT T T TT GAGGAGGAT GAACACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1443 CAGAAGGAGTTCTCCGTGGGCATAATTGATGACGACATTTTT GAGGAGGAT GAACACTT C 1502 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1503 TT T GTAAGGT T GAGCAAT GT C C G C AT AGAGGAGGAGCAGC C AGAGGAGGGGAT GC CT CC A 1562 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1563 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1622 

Qy 1561 GTTACCAT CTT GGAT GAT GACCATGCAGGCAT CTTCACTTTT GAAT GT GAT ACT ATT CAT 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1623 GTTACCAT CTT GGAT GAT GACCATGCAGGCAT CTTCACTTTT GAAT GTGAT ACTATTCAT 1682 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1683 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1742 

Qy 1681 AC AGT CAT C GT C CC CTT T AGGACAGT AGAAGGGACAGCCAAGGGT GG C GGT GAGGACTTT 174 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1743 AC AGT CAT C GT C CC CTTT AGGACAGTAGAAGGGACAGC CAAGGGT GGCGGT GAGGACTTT 1802 

Qy 1741 GAAGAC AC AT AT GGGGAGT T GGAAT TCAAGAAT GAT GAAACT GT GAAAAC C AT AAGG GTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1803 GAAGACACATAT GGGGAGTT GGAATTCAAGAAT GATGAAACT GTCAAAACAATTCACAT C 1862 

Qy 1801 AAAAT AGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGAATTT CTTCATT GC C CTT GGT GAA 1860 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1863 AAGGTAATT GAT GAT GAGGCATAT GAGAAAAACAAGAATTACTTCATTGAGATGAT GGGC 1922 

Qy 1861 C C GAAAT GGAT GGAAC GT GGAAT AT C AGAT GT G ACAGACAGGAAGCTG 1908 

II I I I I I II III I I I I I I I I I I I I I I 

Db 1923 C C C CG C AT GGT GGAT AT GAGT TT T C AGAAAGC GCT C CT GT TAT CT C C AGACAGGAAGCT G 1982 

Qy 1909 ACT AT GGAAGAAGAG GAGGC CAAGAGGAT AGC AGAGAT GGGAAAGC C AGT ATT GG GT GAA 1968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1983 AC TAT GGAAGAAGAG GAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC C AGT ATT GG GT GAA 2042 



Qy 

Db 



1969 CAC CC CAAACT AGAAGT CAT CAT T GAAGAGT C CT AT GAGT T CAAGACTAC GGT G GACAAA 2028 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2043 CACCCCAAACTAGAAGTCAT CATT GAAGAGTCCTATGAGTTCAAGACTACGGTGGACAAA 2102 



Qy 2029 CT GAT CAAGAAGACAAAC CT GGC CT T GGT T GT GGG GAC C C AT TC CT GGAGGGAC C AGT TC 2088 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2103 CT GAT CAAGAAGACAAAC CT GGC CT T GGT T GT GGGGAC CC AT T CCT GGAGGGAC CAGT TC 2162 

Qy 2089 AT GGAGGCCAT CAC C GT C AGT GC AGCAGGGGAT GAGGAT GAGGAT GAAT C C GGGGAGGAG 2148 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2163 AT GGAGGCCAT CAC C GT CAGT GC AGCAGGGGAT GAGGAT GAGGAT GAAT CC GGGGAGGAG 2222 

Qy 2149 AGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTG 2208 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2223 AGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTG 2282 

Qy 2209 TTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATC 2268 

I I I I I I I I I I I I I I I I I I I I III III I I I I I III I I I I I I I I I I III II III III I I I I I 

Db 2283 TTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATC 2342 

Qy 2269 CTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACC 2328 

I I I I I I I I I I I I I II I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I II I I 
Db 2343 CTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACC 2402 

Qy 2329 ATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCA 2388 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2403 ATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCA 24 62 

Qy 2389 GATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGC 2448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2463 GATACGTTTGCCAGCT^AAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGC 2522 

Qy 2449 AACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTG 2508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2523 AACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTG 2582 

Qy 2509 GCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCC 2568 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2583 GCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCC 2642 

Qy 2569 TTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGA 2628 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2643 TTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGA 2702 

Qy 2629 AGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACA 2688 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2703 AGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACA 2762 

Qy 2689 TGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGC 2748 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 63 TGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGC 2822 

Qy 2749 TACATCAAGGGGTTCTAA 2766 

I I I I II I I I I I I I I I I I I 
Db 2823 TACATCAAGGGGTTCTAA 2840 
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PA (CURA-) CURAGEN CORP. 
XX 

PI Padigaru M, Shenoy SG, Kekuda R, Rastelli L, Mezes PD; 

PI Smithson G, Guo X, Gerlach V, Casman SJ, Boldog FL, Li L; 

PI Zerhusen BD, Tchernev VT, Gangolli EA, Vernet CAM, Spytek KA; 

PI Malyankar UM f Patturajan M, Miller CE, Taupier RJ, Heyes MP, Ju J; 

PI Peyman JA, Catterton E, Macdougall JR, Edinger SR, Stone DJ; 

PI Mazur A; 

XX 



DR WPI; 2003-046862/04. 

DR P-PSDB; ABU12041. 
XX 

PT New isolated NOVX polypeptide useful for treating cardiomyopathy, 

PT atherosclerosis, metabolic disorders, diabetes, obesity, infectious 

PT disease, anorexia, neurodegenerative disorders, Alzheimer f s disease and 

PT cancer. 

XX 

PS Claim 3; Page 83-84; 425pp; English. 
XX 

CC This invention describes novel polypeptides, termed NOVX which have 

CC antidiabetic, antiarteriosclerotic, anorectic, metabolic, antimicrobial, 

CC neuroprotective, antiparkinsonian, antilipaemic, cytostatic, nootropic, 



CC cardiant and immunomodulatory activity. The polypeptide and any 

CC antibodies generated from it are useful in the manufacture of a 

CC medicament for treating a syndrome associated with a human disease 

CC selected from a pathology associated with the NOVX polypeptide. Fragments 

CC and portions of the polynucleotides encoding NOVX polypeptides are useful 

CC to map the location of NOVX genes on a chromosome, to identify 

CC individuals from minute biological samples, as DNA markers for 



CC restriction fragment length polymorphism (RFLP) , and are useful to 

CC prepare polymerase chain reaction primers . The products of the invention 

CC can be used in gene therapy and for treating cardiomyopathy, metabolic 

CC disorders, diabetes, atherosclerosis, obesity, infectious disease, 

CC anorexia, neurodegenerative disorders, Alzheimer's disease, Parkinson's 

CC disease, immune disorders, haematopoietic disorders, and various 

CC dyslipidaemias, metabolic disturbances associated with obesity, metabolic 

CC syndrome X and wasting disorders associated with chronic diseases and 

CC various cancers. ABX56261-ABX56306 represent the polynucleotide fragments 

CC which encode the NOVX polypeptides represented in ABU12041-ABU12086 

XX 

SQ Sequence 2813 BP; 617 A; 716 C; 813 G; 667 T; 0 U; 0 Other; 



Query Match 85.6%; Score 2367.2; DB 7; Length 2813; 

Best Local Similarity 91.2%; Pred. No. 0; 

Matches 2542; Conservative 0; Mismatches 223; Indels 21; Gaps 2 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 68 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 69 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 128 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGG GT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 129 ACAGGGCAGAACAAT GAGT C CTGT T CAGGGT CAT C GGACT GCAAGGAGGGTGT CAT C CT G 188 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 189 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 248 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 249 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 308 



Qy 301 T CTATTGAAGT CAT C AC CT CT CAAGAGAGGGAGGT GACAATT AAGAAACC CAAT G GAGAA 360 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 309 T CTATTGAAGTCATCACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 368 

Qy 361 AC CAGC ACAAC C ACT AT T C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CTT AT GGC C 420 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 369 AC CAGCACAAC C AC T AT T C GGGT CT GGAAT GAAACT GTCTCCAACCT GAC C CTT AT GGCC 428 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 429 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 488 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

Mill Ml III III! Ill M II I II III III I III I I I I I III I I III till II Mil II 

Db 489 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 8 

Qy 541 AT CAT TGGC AT CT GT GT CT AC GT GAT C C CAGAC GGAGAGACT CGCAAGAT CAAGC AT CT A 600 

I I I II II II I I I I I I I I I II II I I I I I I I I I I I I I I I I II II I II I I I II I I I I I I I I II 
Db 549 AT CATTGGCATCT GTGT CTACGT GAT CCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 608 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I II II II II M II II I II II I II I I I II II I II II I I I II I II II II II II II I II I I 
Db 609 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 668 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I II I II I II I I I I I II I I I I II II I I I I I I I I I I I I I II I II II I II II M I II I II I I 
Db 669 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 728 

Qy 721 TT T CCAGTGT GT GT CCTT CT GGCCT GGGTGGCAGATAAACGACT GCT CTT CTACAAATAC 780 

I I II I II II I I I I I I II I II I I I I I I I II I I I II I I I II I I I I I I I I I I I II I I I I I I II 
Db 729 TTT CCAGTGT GT GT CCTT CT GGCCT GGGTGGCAGATAAACGACT GCT CTT CTACAAATAC 788 

Qy 781 AT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGT GAC 840 

I I II I I I I II I I I II I I II I II I I I I I II I I I I II II I I I II I I I I I M I I I I I I I I II I 

Db 789 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 84 8 

Qy 841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATTCCCATTTT CT AGATGGGAAC 900 

I I M I II II I I I I II I I I II II I I I I I II I I I I II I I I I I II II I II I I I II II I I I I II 

Db 849 CACCCTAAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATTCCCATTTTCT AGATGGGAAC 908 

Qy 901 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT C C GGATT CT C 960 

I I I I I II I I I I I I I I I I I M I II I I I I II I II II I II I I I I I II II II I I II I I I I I I II 

Db 909 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT C C GGATT CT C 968 

Qy 961 AAGGAT CTGAAGCAAAAACAC C CAGAGAAG GACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

I I II I II II I I I I II I I I II I II I I I I II I I I II I II II I I I II II I I I I M I II I I I I I 

Db 969 AAGGAT CT GAAG CAAAAACACC CAGAGAAG GACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1028 

Qy 1021 TACT AT GCT CT T T C C CAC CAACAGAAGAGC C G C GC CT T CT AC C GT AT C CAAG C CACT C GT 1080 

I I I II I I I I I I I II I I I I II I I I I I I I I I I I I I I I I II I I I II I I II I I I II I I I I I I I 
Db 1029 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1088 

Qy 1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAG GC C 1140 

I I I II II I II I I II I I I I I I I II I I I I I I I I I II I I I I I I I I I II II II I I I I I I I I I I I 
Db 1089 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAG GC C 1148 

Qy 1141 T C CAGCATGAGC GAG GT GC ACACC GAT GAGCCT GAGGACTTT AT T T C CAAGGT CT T CT T T 1200 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1149 T CCAGC AT GAGC G AGGT GCACACC GAT GAGC CT GAGGACTTT ATT T C CAAGGT CT T CT TT 1208 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1209 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1268 

Qy 12 61 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAAC AGAGGAT GGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1269 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT AC AAAACAGAGGAT GGTT CTGCC 1328 

Qy 1321 AATGCAGGGGCTGACTAT GAGTTCACAGAGGGCACGGT GGTT CTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1329 AAT GCAGGGGCT GACT AT GAGTT C AC AGAGGGCAC GGT G GTT CTGAAGC C AG GAGAGACC 138 8 

Qy 1381 CAGAAGGAGTT CT C C GT GG GC AT AATT GAT GAC GACAT TTT T GAGGAGGATGAACACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1389 CAGAAGGAGTT CT C C GT GG GC ATAAT T GAT GAC GACAT TTT T GAGGAGGATGAACACT T C 1448 

Qy 1441 T TT GTAAGGTT GAGCAAT GTC CGC AT AGAGGAGGAGCAG C C AGAGGAGGG GAT GC CT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1449 TTT GTAAGGTT GAGCAAT GTC CGC AT AGAGGAGGAGCAGCC AGAGGAGGGGAT GCCT CCA 1508 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1509 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1568 

Qy 1561 GT T ACC AT CTT GGAT GAT GAC CAT GC AGG CAT CT T C ACT TTT GAAT GT GAT ACT ATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1569 GT T AC CAT CTT GGAT GAT GAC CAT GC AGG CAT CT T CACT TTT GAAT GT GAT ACT AT T CAT 1628 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1629 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 8 

Qy 1681 ACAGT CAT C GT CC C CT T T AGGACAGT AGAAG GGACAGC C AAGGGT GG CGGT GAGGACT TT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1689 AC AGTC AT C GT CC C CTT T AGGACAGT AGAAGGGACAGCCAAGGGT GGCGGTGAGGACT TT 174 8 

Qy 1741 GAAGACACATATGGGGAGTTGGAATTCAAGAATGATGAAACTGTGAAAACCATAAGGGTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I III 
Db 1749 GAAGAC AC AT AT GGGGAGT T G GAATT CAAGAAT GAT GAAACT GT GAAAACTCTT CAGGTG 1808 

Qy 1801 AAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGAAT TTCTTCATTGCCCTTGGT GAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1809 AAGAT AGTT GAT GAC GAGGAATAT GAGAAAAAGGATAAT T T CTT CAT T GAGCT GGGC C AG 1868 

Qy 1861 C C GAAAT G GAT GGAAC GT GGAAT AT C AGAT GT GACA GAC AGG 1902 

II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1869 CCCCAGTGGCTTAAGCGAGGGATTTCAGCTCTGCTACTCAATCAAGGGGATGGGGACAGG 1928 

Qy 1903 AAGCT GACT AT GGAAGAAGAG GAG G C CAAGAGGAT AGC AGAGAT GGGAAAGC C AGT ATT G 1962 

I I I I I II II II II. II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1929 AAGCTAACAGCCGAGGAGGAGGAGGCTCGGAGGATAGCAGAGATGGGCAAGCCAGTTCTT 1988 

Qy 1963 G GT GAACACC C CAAACTAGAAGT CAT CAT T GAAGAGT CC TAT GAGTT CAAGACTACGGTG 2022 

I I II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1989 GGG GAGAACT GC C GGCT GGAGGT CAT CAT C GAGGAGT CAT AT GATTT TAAGAAC AC GGT G 2048 

2023 GACAAACT GAT CAAGAAGACAAAC CT GGC CTT GGT T GT GGG GAC C CATT C CT GGAGGGAC 2082 

II I I I I I I I I I I I I I II III I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
2049 GATAAACT CAT CAAGAAAACGAACT T GGC CTT GGT AATT GGGAC C CATT CAT G GAGGGAG 2108 

2083 CAGTTCAT GGAGGC C AT CACCGT CAGT GCAGCAGGGGAT GAGGAT GAGGAT GAA TCC 2139 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
2109 CAGT TT T T AGAGGCAATT AC GGT GAGCG CAGGG GAC GAGGAGGAGGAGGAGGAC GGGT CC 2168 

2140 GGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGG 2199 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
2169 CGGGAGGAGCGGCTGCCGTCGTGCTTTGACTACGTGATGCACTTCCTGACGGTGTTCTGG 2228 



2200 AAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCC 2259 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2229 AAGGTGCTCTTCGCCTGTGTGCCCCCCACCGAGTACTGCCACGGCTGGGCCTGCTTTGGT 2288 



2260 



2319 



GTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTC 

I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2289 GTCTCCATCCTGGTCATCGGCCTGCTCACCGCCCTCATTGGGGACCTCGCCTCCCACTTC 2348 

2320 GGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACC 2379 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I II I I I I I I I 
2349 GGCTGCACCGTTGGCCTCAAGGACTCTGTCAATGCTGTTGTCTTCGTTGCCCTGGGCACC 24 08 

2380 T CT GT C C CAGAT AC GTTT GC CAGCAAAGCT GCT GCC CT CCAGGAT GT AT AT GC AGAC G CC 2439 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2409 TCCATCCCTGACACGTTCGCCAGCAAGGTGGCGGCGCTGCAGGACCAGTGCGCCGACGCG 24 68 

2440 TCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCC 24 99 

I I I I I I I I I I I I I I I I III I I I I I I II II II I I I I I III I III I III 
2469 TCCATCGGCAACGTGACCGGCTCCAACGCGGTGAACGTGTTCCTTGGCCTGGGCGTCGCC 2528 

2500 TGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGC 2559 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2529 TGGTCTGTGGCCGCCGTGTACTGGGCGGTGCAGGGCCGCCCCTTCGAGGTGCGCACTGGC 2588 

2560 ACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTC 2619 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I 

2589 ACGCTGGCCTTCTCCGTCACGCTCTTCACCGTCTTCGCCTTCGTGGGCATTGCCGTGCTG 2648 

2620 TTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTC 2679 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
2649 CTGTACCGGCGCCGGCCGCACATCGGCGGCGAGCTGGGCGGCCCGCGCGGACCCAAGCTC 2708 

2680 GCCACAACAT GGCT CTT TGTGAGCCTGTGGCTCCTCTACAT ACT CTTTGCCAC ACT AGAG 2739 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2709 GCCACCACCGCGCTCTTCCTGGGCCTCTGGCTCCTGTACATCCTCTTCGCCAGCCTGGAG 2768 

2740 GCCTATTGCTACATCAAGGGGTTCTA 2765 

I I I I I I I I I I I I I I I I I I I I 
2769 GCGTACTGCCACATCCGGGGCTTCTA 2794 



RESULT 12 
ACC00414 



ID ACC00414 standard; cDNA; 2534 BP. 
XX 

AC ACC00414; 
XX 

DT 04-JUL-2003 (first entry) 
XX 

DE Human 69039 coding sequence. 
XX 

KW Human; 69039; neuroprotective; gene therapy; haematopoietic disorder; 

KW Na+/Ca2+ exchanger; ion transporter; neural tissue; 

KW neurological disorder; gene; ss. 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 343. .2130 

FT /*tag= a 

FT /product= "Human 69039" 

XX 

PN WO2003029410-A2 . 
XX 

PD 10-APR-2003. 
XX 

PF 27-SEP-2002; 2002WO-US030817 . 
XX 

PR 28-SEP-2001; 2001US-0325737P . 
XX 

PA (MILL-) MILLENIUM PHARM INC. 
XX 

PI Carroll JM; 
XX 

DR WPI; 2003-381617/36. 

DR P-PSDB; ABR40134. 
XX 

PT Identifying a nucleic acid molecule associated with a disorder for 

PT preparing a composition for treating hematopoietic or neurological 

PT disorder by detecting the presence of a nucleic acid molecule in the 

PT sample that is amplified. 
XX 

PS Claim 1; Page 109-110; 133pp; English. 
XX 

CC The present sequence is the coding sequence for human 69039, a novel 

CC Na+/Ca2+ exchanger family member (ion transporter) . 69039 was shown to be 

CC expressed in human haematopoietic cells, e.g. CD34-expressing progenitor 

CC cells as well as in neural tissues, e.g. brain cortex and hypothalamus. 

CC 69039 may therefore be used for preparing a composition for treating 

CC haematopoietic or neurological disorder 

XX 

SQ Sequence 2534 BP; 602 A; 595 C; 644 G; 693 T; 0 U; 0 Other; 

Query Match 64.6%; Score 1786.4; DB 7; Length 2534; 
Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1787; Conservative 0; Mismatches 1; Indels 0; Gaps 0 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I 

Db 343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 



Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 403 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 4 62 

Qy 121 ACAGGG CAGAACAAT GAGT C CT GTT CAG GGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 463 ACAGGG CAGAACAAT GAGT C CT GTT CAG GGT C AT CGGACT GCAAGGAGG GT GT CAT C CT G 522 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I II I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 523 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 582 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 583 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 

Qy 301 T CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT TAAGAAAC CCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I- I I I I I I I I I I I 

Db 643 TCTATTGAAGTCATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 702 

Qy 361 AC CAG CACAAC CACT AT T CGGGT CT GGAAT GAAACT GT CT C C AAC CT GACC CT TAT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 703 AC C AGCACAAC CACT ATT C GG GT CT G GAAT GAAACT GT CT CCAAC CT GACC CT TAT GGCC 762 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 763 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 823 ATT GCT GGT GAT CT GGGAC CTT CT AC C ATT GT AGGGAGT GCAGC CT T CAACAT GTT CAT C 882 

Qy 541 ATCATT GGCAT CT GT GTCTACGT GAT CCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 883 AT CATTGGCATCT GT GTCTACGT GAT CCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 942 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 943 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1002 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I II I I M I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 

Qy 781 AT G C ACAAAAAGT AC C GCAC AGACAAACACCGAGGAATT AT CAT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1123 AT GCACAAAAAGT AC C G CAC AGACAAACACCGAGGAATT AT CAT AGAGAC AGAG GGT GAC 1182 

Qy 841 CAC C CT AAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAAT T CC CAT T TT CT AGAT GG GAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I 

Db 1183 CAC C CT AAGGGC ATT GAGAT GGAT GGGAAAAT GAT GAAT T CC CAT T TT CT AGAT GG GAAC 1242 



Qy 901 CT GGTGC C C CTGGAAGGGAAGGAAGT GGAT GAGT C CCGC AGAGAGAT GAT C CGGATT CT C 960 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1243 CT GGT GCC C CT GGAAGG GAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT CC GGATT CT C 1302 

Qy 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGAT GGCCAAT 1020 

I II I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1303 AAGGAT CT GAAGCAAAAACAC C CAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1362 

Qy 1021 T ACT AT GCT CTT T C C C AC CAAC AGAAGAGC CGC GC CT T CTAC C GTAT CCAAGC C ACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1363 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1422 

Qy 1081 AT GATGACT GGT GCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I MM I I I I I III Mill I I I I I I I I I I II I I I I I I I I I I II III II III I I I I I I III I 

Db 1423 AT GATGACT GGT GCAGGCAAT ATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1482 

Qy 1141 T C CAGC AT GAGC GAGGT GC ACAC C GAT GAGC CT GAGGACT T T ATTT C CAAGGT CT T CT TT 1200 

I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I 
Db 1483 T C CAGC AT GAGC GAGGT GC ACAC C GAT GAGC CT GAGGACT T TAT T T C CAAGGT CT T CTTT 1542 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I II I I I II II I I I I I I I I I I I I I I I I II I I I II I I I I I I I II I I I I I I I I I I 
Db 1543 GAC C CAT GT T CT T AC CAGT GCCT GGAGAACTGT GGGGCT GT ACT CCT GACAGT GGT GAGG 1602 

Qy 1261 AAAGGGGGAGACAT GTCAAAGACCATGTATGTGGACT ACAAAACAGAGGATGGTT CT GCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I 
Db 1603 AAAGGGGGAGACAT GTCAAAGACCATGTATGTGGACT ACAAAACAGAGGAT GGTTCT GCC 1662 

Qy 1321 AAT GC AG GGG CT GACT AT GAGT T C AC AGAGGGCAC GGT GGT T CT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1663 AATGCAGGGGCTGACTATGAGTT CACAGAGGGCACGGTGGTT CT GAAGCCAGGAGAGACC 1722 

Qy 1381 CAGAAGGAGT T CT C C GT GGGCAT AATT GAT GAC GAC ATT T T T GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1723 CAGAAGGAGT TCT C C GT GGGCAT AATT GAT GAC GAC ATT T T T GAGGAGGAT GAACACTT C 1782 

Qy 1441 T T T GTAAGGT T GAGCAAT GT CC GC AT AGAGGAGGAGC AGC C AGAGGAGGGGAT GCCT C C A 1500 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1783 T T T GTAAGGT TGAGCAAT GT C C GC AT AGAGGAGGAGC AGC C AGAGGAGGGGAT GC CT C CA 1842 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

Qy 1561 GT T AC CAT CTTGGAT GAT GAC CAT GCAGGCAT CTT C ACTTT T GAAT GTGAT ACT ATT C AT 1620 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1903 GT T AC CAT CTTGGAT GAT GAC CAT GCAGGCAT CTT C ACTTT T GAAT GT GAT ACT ATT CAT 1962 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1963 GT CAGTGAGAGT AT T GGT GT TAT GGAGGT CAAGGT T CTGCGGAC AT CAG GTGCCCGGGGT 2022 

Qy 1681 ACAGT CAT C GT C C C CTT T AGGAC AGT AGAAGGGACAG C CAAGGGT GGCGGT GAG GACT TT 1740 

• I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2023 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 2082 

Qy 1741 GAAGAC AC ATAT GG GGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAA 1788 



Db 



I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 
2083 GAAGACAC AT AT GGGGAGTT GGAAT T CAAGAATGAT GAAACT GT GTAA 2130 



RESULT 13 
ABN83429 

ID ABN83429 standard; DNA; 126512 BP. 
XX 

AC ABN83429; 
XX 

DT 21-AUG-2002 (first entry) 
XX 

DE Human transporter protein gene. 
XX 

KW Human; sodium/ calcium exchanger; transporter; brain; heart; kidney; lung; 

KW spleen; testis; leukocyte; foetal brain; chromosome 14; gene; 

KW single nucleotide polymorphism; SNP; ds . 
XX 

OS Homo sapiens. 



XX 

FH Key Location/Qualifiers 

FT variation replace (378, T) 

FT /*tag= a 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (741. . 742,C-) 

FT /*tag= b 

FT /standard_name= "Single nucleotide polymorphism" 

FT /note= "This variation is an indel" 

FT variation replace (2002, T) 

FT /*tag= c 

FT /standard_name= "Single nucleotide polymorphism" 

FT CDS 2010. .124505 

FT /*tag= d 

FT /product= "Human transporter" 

FT /note= "Contains 5 introns" 

FT exon 2010. .3793 

FT /*tag= e 

FT /number= 1 

FT variation replace (2381, C) 

FT /*tag= f 

FT /standard_name= "Single nucleotide polymorphism" 

FT intron 3794. .109509 

FT /*tag= g 

FT / number = 1 

FT variation replace ( 5165, T) 

FT /*tag= h 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 5402, G) 

FT /*tag= i 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 6794 , C) 

FT /*tag= j 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 9883, G) 

FT /*tag= k 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 10210, C) 



FT /*tag= 1 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 12220, G) 

FT /*tag= m 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 13842, G) 

FT /*tag= n 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 14200, A) 

FT /*tag= o 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 15878, T) 

FT /*tag= p 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 16030, G) 

FT /*tag= q 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 16292, C) 

FT /*tag= r 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 16506, G) 

FT /*tag= s 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 17953, A) 

FT /*tag= t 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (23832, G) 

FT /*tag= u 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (25001, A) 

FT /*tag= v 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (25141, G) 

FT /*tag= w 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (25191, G) 

FT /*tag= x 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (26147, A) 

FT /*tag= y 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (27400, G) 

FT /*tag= z 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (27401, T) 

FT /*tag= aa 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace (29278, C) 

FT /*tag= ab 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 31437, G) 

FT /*tag= ac 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 31857, G) 

FT /*tag= ad 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 33155, A) 



FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 
FT 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



variation 



/*tag= ae 

/standard_name= "Single nucleotide polymorphism" 

replace(39487,C) 

/*tag= af 

/standard__name= "Single nucleotide polymorphism" 

replace(41449,C) 

/*tag= ag 

/standard_name= "Single nucleotide polymorphism" 

replace(42420,C) 

/*tag= ah 

/standard_name= "Single nucleotide polymorphism" 
replace (43256, C) 
/*tag= ai 

/standard_name= "Single nucleotide polymorphism" 

replace(43967,C) 

/*tag= aj 

/standard_name= "Single nucleotide polymorphism" 
replace (48603. . 48604, A- ) 
/*tag= ak 

/standard_name= "Single nucleotide polymorphism" 
/note= "This variation is an indel" 
replace (49560, T) 
/*tag= al 

/standard_name= "Single nucleotide polymorphism" 
replace (52729, G) 
/*tag= am 

/standard_name= "Single nucleotide polymorphism" 
replace (55031, G) 
/*tag= an 

/standard_name= "Single nucleotide polymorphism" 
replace (55066, C) 
/*tag= ao 

/standard_name= "Single nucleotide polymorphism" 
replace (56912, G) 
/*tag= ap 

/standard_name= "Single nucleotide polymorphism" 
replace (58480, T) 
/*tag= aq 

/standard_name= "Single nucleotide polymorphism" 
replace (61128, A) 
/*tag= ar 

/standard_name= "Single nucleotide polymorphism" 
replace (61320, A) 
/*tag= as 

/standard_name= "Single nucleotide polymorphism" 
replace (61444, C) 
/*tag= at 

/standard_name= "Single nucleotide polymorphism" 
replace (62641, C) 
/*tag= au 

/standard_name= "Single nucleotide polymorphism" 
replace (63023, G) 
/*tag= av 

/standard__name= "Single nucleotide polymorphism" 
replace (63051, C) 
/*tag= aw 

/standard_name= "Single nucleotide polymorphism" 



FT variation replace ( 64989, G) 

FT /*tag= ax 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 65929, A) 

FT /*tag= ay 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 66694 , G) 

FT /*tag= az 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 66755, A) 

FT /*tag= ba 

FT /standard__name= "Single nucleotide polymorphism" 

FT variation replace ( 66879, C) 

FT /*tag= bb 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 69156, T) 

FT /*tag= be 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 69280, T) 

FT /*tag= bd 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 70647 , T) 

FT /*tag= be 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 71867 , T) 

FT /*tag= bf 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 71900, T) 

FT /*tag= bg 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 71901, A) 

FT /*tag= bh 

FT /standard_name= "Single nucleotide polymorphism" 

FT variation replace ( 72369 , T) 

FT /*tag= bi 

Query Match 64.5%; Score 1784.8; DB 6; Length 126512; 



Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1786; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I II II I I I I I I I I I I I I I I I 
Db 2010 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 2069 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2070 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 2129 

Qy 121 AC AGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAG GAGG GT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2130 AC AGGGCAGAACAAT GAGT CCT GTT CAGGGTCAT CGGACTGCAAGGAGGGT GT CAT CCT G 2189 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2190 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 224 9 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 



1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 2250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 2309 

Qy 301 T CTAT T GAAGT CAT CACCT CT C AAGAGAGGGAGGT GACAATT AAGAAAC C C AAT G GAGAA 360 

I I I II I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2310 T CTATT GAAGT CAT CAC CT CT.CAAGAGAGGGAGGT GACAATT AAGAAAC C CAAT G GAGAA 2369 

Qy 361 ACCAGCACAAC CACT AT T C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CT T AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2370 AC CAGC ACAACAACT AT T C GGGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CT T AT GGC C 242 9 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2430 CT GGGT TCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGT CAT GGGTTC 2489 

Qy 4 81 AT T GCT GGT GAT CT GGGAC CTT CT AC CATT GTAGGGAGT GCAGC CT T CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2490 AT T GCT GGT GAT CT GGGACCTT CT AC CATT GTAGGGAGT GCAGC CTT CAACAT GTT CAT C 2549 

Qy 541 AT CATTGGCAT CTGTGTCTACGTGAT CCCAGACGGAGAGACT CGCAAGAT CAAGCAT CT A 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2550 AT CATTGGCAT CTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCAT CT A 2609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 2669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 2729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 278 9 

Qy 781 AT GC AC AAAAAGTAC C GC ACAGACAAACACCGAGGAAT TAT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 27 90 AT GC ACAAAAAGT AC C GC ACAGACAAAC ACC GAGGAAT TAT CAT AGAGACAGAGGGT GAC 2849 

Qy 841 CACCCTAAGGGCATT GAGAT GGATGGGAAAATGATGAATT CCCATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2850 CAC C CTAAG GGC ATT GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT T T T CTAGAT GG GAAC 2909 

Qy 901 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C CGCAGAGAGAT GAT C C GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2910 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT C CC GCAGAGAGAT GAT CC GGATT CT C 2969 

Qy 961 AAGGAT CT GAAGCAAAAACACC CAGAGAAGGACTTAGAT CAGCTGGT GGAGAT GGCCAAT 1020 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2970 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGT GGAGATGGCCAAT 3029 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 3089 

Qy 1081 ATGATGACTGGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 3090 ATGATGACT GGT GC AGGCAAT AT CCT GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGC C 314 9 

Qy 1141 T C C AGCAT GAGCGAGGT GCAC AC CGAT GAGC CT GAGGACTTT AT TT C C AAGGT CT T CT T T 1200 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I II 

Db 3150 T C C AGCAT GAGCGAGGT GCAC AC CGAT GAGC CT GAG GACTTTATTT CC AAGGT CT T CT T T 3209 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3210 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 3269 

Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3270 AAAGGGGGAGACATGT CAAAGAC CAT GTATGT GGACTACAAAACAGAGGAT GGTT CTGCC 3329 

Qy 1321 AAT GCAGGGGCT GACT AT GAGTT CAC AGAGGGCAC GGT GGT T CT GAAG C C AGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3330 AATGCAGGGGCT GACTAT GAGTT CACAGAGGGCACGGT GGTTCT GAAG CC AGGAGAGACC 3389 

Qy 1381 C AGAAGGAGT T CT CCGT GGGC AT AAT T GAT GAC GAC ATTTTTGAGGAGGAT GAAC ACT T C 1440 

I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3390 CAGAAGGAGTT CT CCGT GGGC AT AAT T GAT GACGACATTTTTGAGGAGGAT GAACACTT C 3449 

Qy 1441 TTTGTAAGGTTGAGCAAT GT CCGCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GCCTCCA 1500 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 
Db 3450 T TT GTAAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT C C A 3509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 3569 

Qy 1561 GTTACCAT CTT GGATGAT GAC CAT GCAGGCAT CTT CACTTTTGAATGT GATACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3570 GT T ACCAT CTT GGAT GAT GAC CAT GCAGGCAT CTT C ACTTTT GAAT GT GAT ACT AT T CAT 3629 

Qy 1621 GT C AGT GAGAGT AT T GGT GT T AT GGAGGT CAAGGT T CT GCGGACAT CAGGT GC C C GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3630 GTCAGTGAGAGTATTGGT GTTAT GGAGGT CAAGGTTCTGCGGACATCAGGT GCCC GGGGT 368 9 

Qy 1681 ACAGT C ATC GT C C CCT TT AGGACAGT AGAAGG GAC AGC CAAGGGT GGC GGT GAGGACT TT 174 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3690 ACAGT C ATCGT C C C CT TT AGGACAGT AGAAGGGACAGCCAAGGGT GGC GGT GAGGACT TT 374 9 

Qy 1741 GAAGAC ACATAT G GGGAGTT GGAAT T CAAGAAT GAT GAAACT GT GAAA 1788 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3750 GAAGACACAT AT GGGGAGT T G GAAT T CAAGAAT GAT GAAACT GT GTAA 3797 
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XX 
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XX 
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XX 

DE Human ion exchanger protein #2 cDNA. 
XX 



KW Human; ion exchanger protein; NHIEP; nootropic; cytostatic; gene therapy; 

KW antiarthritic; virucide; chemotherapeutic; cancer; arthritis; antiviral; 

KW gene; ss; chromosome 14. 
XX 

OS Homo sapiens. 
XX 
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FT /*tag= a 

FT /product= "Ion exchanger protein 2" 
XX 

PN WO200259316-A2. 
XX 

PD 01-AUG-2002. 
XX 

PF 22-JAN-2002; 2002WO-US001817 . 
XX 
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XX 

PA (LEXI-) LEXICON GENETICS INC. 
XX 

PI Friddle CJ, Hilbun E; 
XX 

DR WPI; 2002-599791/64. 

DR P-PSDB; ABB81914. 
XX 

PT Novel polynucleotides encoding human ion exchanger proteins that are 

PT structurally related to mammalian sodium- calcium exchanger proteins, 

PT useful for drug screening, diagnosis and in gene therapy of biological 

PT disorders. 
XX 

PS Disclosure; Page 39-40; 42pp; English. 
XX 

CC The invention relates to a novel human ion exchanger protein (NHIEP) , 

CC that shares structural similarity with mammalian sodium- calcium exchanger 

CC proteins, and potassium dependent versions of the same. The NHIEP of the 

CC invention has nootropic, cytostatic, antiarthritic, and virucide 

CC activity. The polynucleotide may have a use in gene therapy. NHIEPs can 

CC be targeted by drugs, oligos, antibodies etc., in order to treat disease 

CC or to therapeutically augment the efficacy of chemotherapeutic agents 

CC used in the treatment of cancer, arthritis, or as antiviral agents. The 

CC sequence encodes a NHIEP of the invention 

XX 

SQ Sequence 1863 BP; 464 A; 426 C; 514 G; 459 T; 0 U; 0 Other; 

Query Match 64.5%; Score 1784.6; DB 6; Length 1863; 
Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 



Qy 121 ACAGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 ACAGGGCAGAACAAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGG GT GT CAT C CT G 18 0 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I 

Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 TCTATTGAAGTCAT CACCT CT CAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 360 

till II I I II II III II I II II 1 1 1 1 1 1 1 1 III I 1 1 1 1 1 1 III II II III 1 1 III 1 1 III ■ 

Db 301 TCTATTGAAGTCAT CACCT CT CAAGAGAGGGAGGTGACAATTAAGAAACCCAAT GGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 AT T GCT GGTGAT CT GGGAC CTT CT ACCAT T GT AGGGAGT GCAGCCTT CAAC AT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 AT T GCT GGTGATCT GGGAC CT T CT AC CATT GT AGGGAGT GCAGCCTT CAAC AT GT T CAT C 54 0 

Qy 541 ATCATTGGCAT CTGTGTCT ACGTGAT CCCAGACGGAGAGACTCGCAAGATCAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AT C ATT GGC AT CT GT GT CT AC GT GAT C C CAGACGGAGAGACT CGCAAGAT CAAGCAT CTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GC ACAAAAAGT ACC GC ACAGACAAAC AC CGAGGAATTAT CAT AGAGACAGAG GGT GAC 840 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 AT GC ACAAAAAGT AC C GCACAGACAAAC AC C GAGGAATT AT CAT AGAGACAGAG GGT GAC 84 0 

Qy 841 CACCCTAAGGGCATT GAGAT GGATGGGAAAAT GAT GAATTCCCATTTTCTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I II I I I I I I 

Db 841 C AC C CTAAGG GCAT T GAGAT GGAT GGGAAAAT GAT GAATTC CCAT T T T CT AGAT GGGAAC 900 

Qy 901 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C C GC AGAGAGAT GAT C CGGAT T CT C 960 

I I I I I I I I I I I I I I I II I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 901 CT GGT GCCC CT G GAAG GGAAG GAAGT GGAT GAGT CC C GC AGAGAGAT GAT C C GGAT T CT C 960 

Qy 961 AAGGAT CT GAAGCAAAAAC AC C C AGAGAAGGACT T AGAT CAG CT G GT GGAGAT GGC CAAT 1020 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 

Db 961 AAG GAT CT GAAGCAAAAAC ACCCAGAGAAGGACTT AGAT C AGCT G GT G GAGAT GGC CAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TACT AT GCT CTTT C C CAC CAAC AGAAGAGC C GC GC CTT CT AC C GT AT C CAAG CCACT C GT 1080 

Qy 1081 ATGATGACTGGTGCAGGCAATAT CCT GAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 ATGATGACTGGTGCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCC 1140 

Qy 1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGT CTT CTTT 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 T CC AGCAT GAGCGAGGT GC ACAC C GAT GAGCCT GAGGACTTT ATT TCCAAGGT CT T CT TT 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 12 60 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT G GACT ACAAAAC AGAG GATGGT T CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT AC AAAAC AGAGGAT GGT T C T GC C 1320 

Qy 1321 AAT GC AGGGGCT GACTAT GAGT T CACAGAGGGC AC GGT GGTT CT GAAGCC AGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GCAGGGGCT GACT AT GAGT T CACAGAGGGCAC GGT GGTT CT GAAGCC AGGAGAGAC C 1380 

Qy 1381 CAGAAGGAGTT CT CC GTGGGCATAATT GATGACGACATTTTT GAGGAGGATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTT CTCCGTGGGCATAATTGATGACGACATTTTT GAGGAGGATGAACACTT C 1440 

Qy 1441 TTT GTAAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGC AGC CAGAG GAGGGGAT GC CT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 T TT GTAAG GTT GAGCAAT GT C C GCAT AGAGGAGGAGC AGC CAGAG GAGGGGAT GC CT C CA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GTTACCAT CTT GGAT GATGACCATGCAGGCAT CTT CACTTTTGAATGT GATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTTACCAT CTT GGAT GAT GACCAT GCAGGCAT CTT CACTTTT GAATGT GATACTATTCAT 1620 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GT C AGT GAGAGT AT T G GT GTT AT GGAGGT CAAGGT T CT GC GGACATCAGGTGC C C GGGGT 1680 

Qy 1681 ACAGT CAT CGT CCC CT TT AGGAC AGTAGAAGGGAC AG C CAAGGGT GGC GGTGAG GACT TT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 ACAGT CAT CGT C C C CT TT AG GACAGT AGAAGG GAC AGC CAAGGGT GGC GGT GAGGACT TT 1740 

Qy 1741 GAAGAC ACAT AT G GG GAGTT G GAAT T CAAGAAT GAT GAAAC T GT GAAAAC CAT AAG 1796 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1741 GAAGACACAT AT GGG GAGT T GGAAT T CAAGAAT GAT GAAACT GT ATGT GACAGAC AGGAA 1800 

Qy 1797 GGTTAAAAT AGTAGAT GAG GAG GAAT ACGAAAGGCAAGAGA 1837 

III I I I I I I I I I I I I I I I I I I I I 



Db 1801 G CT GACT AT GGAAGAAGAGGAGGC CAAGAGGATAGC AGAGA 1841 



RESULT 15 
AAH57377 

ID AAH57377 standard; cDNA; 2814 BP. 
XX 

AC AAH57377; 
XX 

DT 10-SEP-2001 (first entry) 
XX 

DE Human heart cell specific cDNA sequence SEQ ID NO: 217. 
XX 

KW Human; tissue specific; diagnosis; brain; heart; skeletal muscle; lung; 

KW liver; uterus; ovary; stomach; intestine; kidney; pancreas; ss; 

KW metabolic disease; developmental disease; cytostatic; immunomodulatory; 

KW neuroprotective; gene therapy; cancer; immunopathology; neuropathology. 

XX 

OS Homo sapiens. 
XX 

PN WO200132927-A2. 
XX 

PD 10-MAY-2001. 
XX 

PF 02-NOV-2000; 2000WO-US030396 . 
XX 

PR 04-NOV-1999; 99US-0163508P . 
XX 

PA (INCY-) INCYTE GENOMICS INC. 
XX 

PI Sornasse T, Seilhamer JJ, Watson GA; 
XX 

DR WPI; 2001-291057/30. 
XX 

PT New cell and tissue specific polynucleotides useful for diagnosis, 

PT prognosis or monitoring of treatments for disorders where the gene is 

PT associated with a cancer, immunopathology or neuropathology. 
XX 

PS Claim 1; Page 146-147; 327pp; English. 
XX 

CC AAH57161 to AAH57576 represent cell and tissue specific polynucleotide 

CC sequences (I) . (I) can have cytostatic, immunomodulatory and 

CC neuroprotective activities, and can be used in gene therapy. (I) and 

CC proteins (II) encoded by then are used in high throughput screening 

CC assays to select DNA molecules, RNA molecules, peptide nucleic acids, 

CC mimetics, peptides, proteins, agonists, antagonists, antibodies or their 

CC fragments, immunoglobulins, inhibitors, drug compounds and pharmaceutical 

CC agents. Expression of (I) in a sample indicates the differentiation of 

CC embryonic stem cells into a tissue selected from brain, heart, kidney, 

CC liver, lung, skeletal muscle or pancreatic tissues. (I) and (II) are used 

CC to produce an expression profile that defines a metabolic or 

CC developmental process, treatment, condition, disease or disorder. The 

CC gene profile can be used for diagnosis, prognosis or monitoring of 

CC treatments and for investigating a predisposition to a disorder where the 

CC gene is associated with a cancer, immunopathology or neuropathology 

XX 

SQ Sequence 2814 BP; 754 A; 579 C; 718 G; 763 T; 0 U; 0 Other; 



Query Match 48.0%; Score 1326.4; DB 4; Length 2814; 

Best Local Similarity 69.8%; Pred. No. 0; 

Matches 1893; Conservative 0; Mismatches 756; Indels 63; Gaps 5; 



Qy 109 GACGTGCCAAGCACAGGGCAGAACAATGAGT CCT GTTCAGGGTCAT CGGACTGCAAGGAG 168 

II II II III I I I I I I I I I I I I I I I I I I I I I I I 

Db 112 GAAAT GGAAGGAGAAGGAAAT GAAACT GGT GAAT GT ACT GGATCAT ATT ACT GTAAGAAA 171 

Qy 169 GGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGG 228 

I I I I I I I I II I I I I I I II I II I I I I I I I II I I I I I I I I I I I I I 

Db 172 GGGGTGATTTTGCCCATTTGGGAACCCCAAGACCCTTCTTTTGGGGACAAAATTGCTAGA 231 

Qy 229 GTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGAC 288 

I I III I II I I I II I I II II I I II I I I I I I I I I I II II I I I II I I I I I 

Db 232 GCTACTGTGTATTTTGTGGCCATGGTCTACATGTTTCTTGGAGTCTCTATCATAGCTGAT 291 

Qy 289 C GCTT CAT GGC AT CT AT T GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAATTAAGAAA 348 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I 

Db 292 CGGTTCATGTCCTCT ATAGAAGT CAT CACAT CT CAAGAAAAAGAAATAACCATAAAGAAA 351 

Qy 349 CCCAAT GGAGAAAC C AGCACAAC CACTATT CGGGT CT GGAAT GAAACTGT CT CCAAC CTG 408 

I I II I I I I I II I I I I II II III I II I I I I II I I I I I I I I I II I I I I I I 

Db 352 C C CAAT GGAGAGACC ACCAAGACAACTGT GAGGAT CTGGAAT GAAACAGT T T CT AAC CT G 411 

Qy 409 ACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGT 468 

III I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 412 ACCTTGATGGCCCTGGGATCTTCTGCTCCTGAGATTCTCCTTTCAGTAATTGAAGTGTGT 471 

Qy 469 GGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTC 528 

II III I I I I III II II II II III I I I I I II II I I I II II Ml 

Db 472 GGCCATAACTTCACTGCAGGAGACCTCGGTCCTAGCACCATCGTGGGAAGTGCTGCATTC 531 

Qy 529 AACAT GT T CAT CAT C ATT GGC AT CT GT GT CT ACGT GATC CC AGAC GGAGAGACT C GCAAG 588 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 532 AAT AT GT T CAT C ATT ATT G CACT CT GT GT T TAT GT GGT GC CT GAC GGAGAGACAAGGAAG 591 

Qy 589 ATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGG 648 

II I I I II I I II I I I I II I I I II II I I I I I II I I I I I II II I I I I I II I 

Db 592 ATTAAGCATTTGCGTGTCTTCTTTGTGACAGCAGCCTGGAGCATCTTTGCCTACACCTGG 651 

Qy 649 CTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTC 708 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 652 CTTTACATTATTTTGTCTGTCATATCTCCTGGTGTTGTGGAGGTCTGGGAAGGTTTGCTT 711 

Qy 709 ACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTC 768 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 712 ACTTTCTTCTTCTTTCCCATCTGTGTTGTGTTCGCTTGGGTAGCGGATAGGAGACTTCTG 771 

Qy 769 TT CTACAAATACAT GCACAAAAAGTACCGCACAGACAAACACCGAGGAATT ATCATAGAG 828 

I I I I I I I I I I I I I I I I I I I I I I II I I I I II II I I II I I 

Db 772 T T T T AC AAGT AT GT CT ACAAGAG GT ATC GAGCT GGCAAGCAGAG GGGGAT GAT T ATT GAA 831 

Qy 829 AC AGAGGGT GAC CAC CC TAAGG GC AT T GAGAT GGAT GGGAAAAT GAT GAAT 879 

II II III II I I II I I I II I I I I I I I II II I I I I 

Db 832 CAT GAAGGAGACAGGCCAT CT T CT AAGACT GAAAT T GAAAT GGACGGGAAAGT G GT CAAT 891 



Qy 880 TCCCATTTTCTAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 921 

I I I I I I I I I I I I I I I I III 

Db 892 T CTC AT GTT GAAAATTT CT T AGAT GGTGCT CT GGT T CT GGAGGT GGAT G AGAGGGACCAA 951 

Qy 922 GAAGT GGAT GAGT C C C GC AGAGAGAT GAT C C GGAT T CT CAAGGATCT GAAGCAAAAAC AC 981 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 952 GATGAT GAAGAAGCT AGGC GAGAAAT GGCTAGGATT CT GAAGGAACT TAAGC AGAAGCAT 1011 

Qy 982 C C AGAGAAGGACT T AGAT C AGCT GGT GGAGAT GGC CAATTACT ATGCT CT TT C CCACCAA 1041 

I I I I I I I I I I I I I I I I III I II I I I I I I I II I I I I 

Db 1012 C C AGATAAAGAAAT AGAGCAAT TAAT AGAATT AGCTAACTAC CAAGT C CTAAGT C AGC AG 1071 

Qy 1042 CAGAAGAGCC GC GC CT T CT ACC GT AT CC AAGC CACT C GT AT GAT GACT GGTGCAGGCAAT 1101 

II II II I II II II I I I I I I I I I I I I I I II III I I II M I I I I I 

Db 1072 CAAAAAAGTAGAGCATTTTATCGCATTCAAGCTACTCGCCTCATGACTGGAGCTGGCAAC 1131 

Qy 1102 AT CCT GAAGAAAC AT GCAG C AGAACAAGCCAAGAAGGC CT CC AGCAT GAGCGAGGT GC AC 1161 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1132 ATTTTAAAGAGGCATGCAGCTGACCAAGCAAGGAAGGCTGTCAGCATGCACGAGGTCAAC 1191 

Qy 1162 ACCGATGAGCCTG AGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAG 1218 

I I I I I I I II I I I I III II I I I I I I I I I II I I I I I I I I I 
Db 1192 ACT GAAGT GACT GAAAAT GACC CT GTTAGT AAGAT CTT CT TT GAACAAGGGAC AT AT CAG 1251 

Qy 1219 T GCCT GGAGAACT GT GG GGCT GT ACT CCT GAC AGT GGT GAGGAAAGGGGGAGACAT GT C A 1278 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1252 TGTCTGGAGAACTGTGGTACTGTGGCCCTTACCATTATCCGCAGAGGTGGTGATTTGACT 1311 

Qy 1279 AAGACCAT GT AT GT GGACT ACAAAACAGAGGATGGT T CTGCCAATGC AGGGGCT GACT AT 1338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1312 AACACT GT GT TT GT T GACTT CAGAACAGAGGATGGCAC AG CAAATGCT GGGT CT GATT AT 1371 

Qy 1339 GAGTT CACAGAGGGCAC GGT GGTT CT GAAGC C AGGAGAGAC C CAGAAGGAGTT CT C C GT G 1398 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 1372 GAATTTACTGAAGGAACT GT GGTGTTTAAGCCTGGT GATACCCAGAAGGAAAT CAGAGT G 1431 

Qy 1399 GGC AT AATTGAT GAC GACAT TTTT GAGGAGGATGAAC ACT T CT T TGT AAGGT T GAGCAAT 1458 

II II II I I I I I II II I I I I I I I I I I I I I I I I III I I II I I I I I I I 

Db 1432 GGT AT CAT AGAT GAT GAT AT CTTT GAGGAGGAT GAAAATT T C CT TGT GC AT CT C AGCAAT 1491 

Qy 1459 GT CCGCATAGAGGAGGAGC AGCCAGAGGAGGGGAT GC C TC C AGCAAT ATT CAAC AGT CT T 1518 

I II II II I I I I I I I I I I I III I I I I I 

Db 1492 GT CAAAGTAT CT T CT GAAGCTT C AGAAGAT GGCAT ACT GGAAGC CAATCAT 1542 

Qy 1519 CCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGAT 1578 

I II III I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1543 GTTTCTACACTTGCTTGCCTCGGATCTCCCTCCACTGCCACTGTAACTATTTTTGATGAT 1602 

Qy 1579 GACC AT GCAGGCAT CTT CACTT TT GAAT GT GAT ACT ATTC AT GT CAGT GAGAGT AT T GGT 1638 

Mill I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1603 GACC AC GCAGGCAT TT T TACTT T T GAGGAACCTGT GACTCAT GT GAGT GAGAGC AT T GGC 1662 

Qy 1639 GTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTT 1698 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1663 ATCAT GGAGGT GAAAGT ATT GAGAACAT CTGGAGCTCGAGGAAATGTTAT CGTT C CAT AT 1722 

Qy 1699 AG GACAGTAGAAG GGAC AGC CAAG GGT GGC G GTGAGGACT TT GAAGACAC AT AT G G GGAG 1758 



I II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 j 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 

Db 1723 AAAACCAT CGAAGGGACT GC C AGAGGT GGAGGGGAGGAT TTT GAGGACACTT GT GGAGAG 1782 

Qy 1759 TTGGAATTCAAGAATGATGAAACTGTGAAAACCATAAGGGTTAAAATAGTAGATGAGGAG 1818 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1783 CT C GAAT T C CAGAAT GAT GAAATT GT GAAGAT CAT T AC CAT T AG AAT ATT T GAC C GT GAG 1842 

Qy 1819 GAAT AC GAAAGGCAAGAGAAT TT CTT CAT TGCCCTTGGT GAAC CGAAAT GGATGGAAC GT 1878 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1843 GAAT AT GAGAAAGAGT GCAGT TT CT CCCT T GT GCTT GAGGAACCAAAAT GGATAAGAAGA 1902 

Qy 1879 GGAATATCAG AT GT GACAGACAGGAAGCTGACT AT G 1914 

I I I I I II III I I I I I I I I 

Db 1903 GGAAT GAAAGGT GGCTT C ACAATAAC AGAC GAAT AT GAT GACAAG C AGCCACTGAC CAGC 1962 

Qy 1915 GAAGAAGAGGAGGCCAAGAGGAT AG C AGAGAT GGGAAAG C CAGT ATT GGGT GAACACC C C 1974 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 1963 AAAGAGGAAGAGGAGAGGC GCATT GCAGAAAT GGGGCGCC C CAT C CT G GGAGAGC AC AC C 2022 

Qy 1975 AAACT AGAAGT CAT CAT T GAAGAGT C CT AT GAGT T CAAGACT AC GGT GGACAAACT GAT C 2034 

II I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I III I I I I I II I I I I II 

Db 2023 AAGTT GGAAGTGATCATT GAAGAAT CCTATGAATTCAAGAGTACT GTGGACAAACTCATT 2082 

Qy 2035 AAGAAGACAAAC CT GGC CT T GGTT GTGGGGACC CATT C CT GGAGGGACC AGTT C AT GGAG 2094 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I I I I I I I I II 

Db 2083 AAGAAGACAAAC CTGGCCCTT GT GGTT GGGACTAACAGCT G GAGAGAAC AGTT C ATTGAA 2142 

Qy 2095 GCCATCACCGT CAGT GCAGCAGGGGAT GAG GAT GAGGAT GAAT CCGGGGAGGAGAGGCTG 2154 

II I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 

Db 2143 GCT AT CACT GT CAGT GCT GGGGAAGAT GAT GAC GAC GAT GAAT GT GGGGAAGAGAAGCT G 2202 

Qy 2155 CCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCC 2214 

I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2203 CCCTCCTGTTTCGATTACGTGATGCACTTTCTGACTGTGTTCTGGAAGGTCCTGTTTGCC 22 62 

Qy 2215 TGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATC 2274 

I II I I I I I II II I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I 
Db 2263 TTCGTCCCCCCTACTGAATACTGGAATGGCTGGGCGTGTTTCATTGTCTCCATCCTCATG 2322 

Qy 2275 ATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGT 2334 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2323 ATTGGCCTACTGACAGCTTTCATTGGAGACCTGGCTTCCCACTTTGGCTGCAC CATT GGC 2382 

Qy 2335 CT CAAAGAT T CAGT C AC AGCT GT T GTT T T C GT GGCAT T T GGCACCT CT GT C C CAGAT ACG 2394 

II I I I I I I I I II II II II II I I I I I III I I I I II II II I I I I I II 

Db 2383 CT GAAAGATT CT GT GACT GCAGT C GT GTT C GT C GC ACT T GGAAC AT C AGT GC CAGAC ACA 2442 

Qy 2395 TTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTG 2454 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 2443 TT T GC CAGCAAAGT GGCAGC C AC CC AGGAC CAGT AT GCAGACGCCT C CAT AG GT AAC GT C 2502 

Qy 2455 ACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCC 2514 

I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II III 
Db 2503 ACGGGCAGCAACGCGGTGAATGTCTTCCTGGGAATCGGTGTGGCCTGGTCCATCGCTGCC 2562 

Qy 2515 ATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCC 2574 

I I I I I I II III I I I I II I I I I I I I I I II I I I I I I I I I I I 



Db 2563 ATCTACCACGCAGCCAATGGGGAACAGTTCAAAGTGTCCCCTGGCACACTAGCTTTCTCT 2622 

Qy 2575 GTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGG 2634 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I It I I I I I I I I I I 

Db 2623 GTCACTCTCTTCACCATTTTTGCTTTCATCAATGTGGGGGTGCTGCTGTATCGGCGGAGG 2682 

Qy 2635 CCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTC 2694 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2683 CCAGAAATCGGAGGTGAGCTGGGTGGGCCCCGGACTGCCAAGCTCCTCACATCCTGCCTC 2742 

Qy 2695 TTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATC 2754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 2743 TTTGTGCTCCTATGGCTCTTGTACATTTTCTTCTCCTCCCTGGAGGCCTACTGCCACATA 2802 

Qy 2755 AAGGGGTTCTAA 2766 

II II I I I I I I 

Db 2803 AAAGGCTTCTAA 2814 



Search completed: June 25, 2004, 07:40:38 
Job time : 985.401 sees 



GenCore version 5.1.6 
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OM nucleic - nucleic search, using sw model 



Run on: 



Title: 

Perfect score: 
Sequence: 
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US-10-054-680-1 
2766 

1 atggcgtggttaaggttgca . 



Search time 210.931 Seconds 
(without alignments) 
7277.246 Million cell updates/sec 



. gctacatcaaggggttctaa 2766 



1365418 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 682709 seqs, 277475446 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 

Database : Issued_Patents_NA: * 

1 : /cgn2_6/ptodata/2/ina/5A_COMB. seq: * 

2 : /cgn2_6/ptodata/2/ina/5B_COMB. seq: * 

3: /cgn2_6/ptodata/2/ina/6A_COMB. seq: * 

4 : /cgn2_6/ptodata/2/ina/6B_COMB. seq: * 

5: /cgn2_6/ptodata/2/ina/PCTUS_COMB.seq:* 

6 : /cgn2_6/ptodata/2/ina/backf ilesl . seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



Result 
No. 



Score 



% 

Query 

Match Length DB 



ID 



Description 



c 
c 



1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 



78.8 
76.6 
76. 
51. 
50. 
46. 
46. 
44.8 
44.2 
43.8 
43.8 



.6 
.6 
.2 
.2 
.2 



2.8 
2.8 
2.8 
1.9 
1.8 
1.7 
1.7 
1.6 



7218 
1935 
1950 
7218 
390 
3984 
4559 
2803 



1.6 4403765 
1.6 1992 
1.6 2658 



1 US-08-232-463-14 

4 US-09-701-068-3 

4 US-09-701-068-1 

1 US-08-232-463-14 

3 US-09-197-649-7 

4 US-09-016-434-1199 
4 US-09-919-172-61 

4 US-09-701-068-4 

3 US-09-103-840A-2 

4 US-09-252-991A-9693 

4 US-09-252-991A-9558 



Sequence 
Sequence 
Sequence 
Sequence 
Sequence 
Sequence 
Sequence 
Sequence 

Sequence 
Sequence 
Sequence 



14, Appl 

3, Appli 
1, Appli 
14, Appl 
7, Appli 
1199, Ap 
61, Appl 

4, Appli 
2, Appli 

9693, Ap 
9558, Ap 





12 


43.8 


1. 


6 


2799 


4 


US-09-252-991A-9604 


Sequence 


9604, Ap 


c 


13 


43.4 


1. 


6 


4411529 


3 


US-09-103-840A-1 


Sequence 1, Appli 




14 


42.2 


1. 


5 


660 


4 


US-09-252-991A-5866 


Sequence 


58 66, Ap 




15 


42.2 


1. 


5 


1983 


4 


US-09-252-991A-5825 


Sequence 


5825, Ap 


c 


16 


42.2 


1. 


5 


1995 


4 


US-09-252-991A-5783 


Sequence 


5783, Ap 




17 


41.8 


1. 


5 


870 


4 


US-09-252-991A-3650 


Sequence 


3650, Ap 




18 


41.8 


1. 


5 


1098 


4 


US-09-252-991A-3605 


Sequence 


3605, Ap 


c 


19 


41.8 


1. 


5 


3402 


4 


US-09-252-991A-1374 


Sequence 


1374, Ap 




20 


41.8 


1. 


5 


3687 


4 


US-09-252-991A-1193 


Sequence 


1193, Ap 




21 


41.8 


1. 


5 


4266 


4 


US- 09-2 52-9 91A- 12 34 


Sequence 


1234, Ap 




22 


41.4 


1. 


5 


4403765 


3 


US-09-103-840A-2 


Sequence 


i 2, Appli 




23 


41.4 


1. 


5 


4411529 


3 


US-09-103-840A-1 


Sequence 1, Appli 




24 


40.2 


1. 


5 


1174 


3 


US-09-034-985-1 


Q A ffl 1 £i T"l f~* O 


1 f Appl i 




25 


40 


1. 


4 


570 


4 


US- 09-252-99 1A- 104 19 


O /-\ « ^ •»-« /-« ^ 

jcquencc 




c 


26 


40 


1. 


4 


789 


4 


US- 0 9-2 52- 9 9 1A- 10 65 4 




± \J U «J *± , /\ 


c 


27 


40 


1 . 


4 


813 


4 


US- 09-2 52-99 1A- 1054 7 








28 


40 


1. 


4 


831 


4 


US- 09-252- 99 1A-1 05 12 




10512 A 




29 


39. 6 


1. 


4 


3431 


4 


US-09-221-017B-993 


Sequence 


993, App 




30 


39.2 


1. 


4 


333 


4 


US-09-252-991A-3700 


Sequence 


3700, Ap 


c 


31 


39 


1. 


4 


642 


4 


US-09-252-991A-4 94 9 


Sequence 


4949, Ap 




32 


39 


1. 


4 


1617 


4 


US-09-489-039A-2262 


Sequence 


22 62, Ap 




33 


39 


1. 


4 


1926 


4 


US-09-249-585A-4 


Sequence 


4, Appli 




34 


39 


1. 


4 


1931 


2 


US-09-130-114-2 


Sequence 


2, Appli 




35 


39 


1 . 


4 


1932 


4 


US- 09-2 52-9 91A-4 998 


Sequence 


4998, Ap 




36 


38 . 6 


1 , 


4 


1548 


2 


Us- 08-7 62- 106- 5 


Sequence 


5, Appli 




37 


38 . 6 


1. 


4 


1548 


3 


Us- 09-32 0-7 74- 5 


Sequence 


5, Appli 


c 


38 


38. 6 


1. 


4 


1581 


2 


Us-08-762-106-6 


Sequence 


6, Appli 


c 


39 


38. 6 


1. 


4 


1581 


3 


US-09-320-774-6 


Sequence 


6, Appli 




40 


38.4 


1. 


4 


318 


4 


US-09-252-991A-10314 


Sequence 


10314, A 




41 


38.4 


1. 


4 


387 


4 


US-09-252-991A-1461 


Sequence 


1461, Ap 




42 


38.4 


1. 


4 


1272 


4 


US-09-252-991A-1552 


Sequence 


1552, Ap 


c 


43 


38.4 


1. 


4 


2777 


4 


US-09-310-463-3 


Sequence 


3, Appli 


c 


44 


38.4 


1. 


4 


2777 


4 


US-08-842-248A-3 


Sequence 


3, Appli 




45 


38.4 


1. 


4 


50937 


3 


US-09-428-517-1 


Sequence 


1, Appli 



ALIGNMENTS 



RESULT 1 

US-08-232-463-14/C 

; Sequence 14, Application US/08232463 

; Patent No. 5670367 

; GENERAL INFORMATION: 

APPLICANT: DORNER, F. 

APPLICANT: SCHEIFLINGER, F. 

APPLICANT: FALKNER, F. G. 

TITLE OF INVENTION: RECOMBINANT FOWLPOX VIRUS 
NUMBER OF SEQUENCES: 52 
CORRESPONDENCE ADDRESS: 
; ADDRESSEE: Foley & Lardner 

STREET: 1800 Diagonal Road, Suite 500 
; CITY: Alexandria 

STATE: VA 
COUNTRY: USA 
ZIP: 22313-0299 
COMPUTER READABLE FORM: 



MEDIUM TYPE: Floppy disk 

COMPUTER: IBM PC compatible 

OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/232,463 

FILING DATE: 

CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/07/935,313 

FILING DATE: 
; APPLICATION NUMBER: EP 91 114 300.6 

; FILING DATE: 26-AUG-1991 

; ATTORNEY/AGENT INFORMATION: 

NAME: BENT, Stephen A. 
; REGISTRATION NUMBER: 29,768 

; REFERENCE/ DOCKET NUMBER: 30472/114 IMMU 

; TELECOMMUNICATION INFORMATION: 
; TELEPHONE: (703)836-9300 

; TELEFAX: (703)683-4109 

; TELEX: 899149 

; INFORMATION FOR SEQ ID NO: 14: 
; SEQUENCE CHARACTERISTICS: 

; LENGTH: 7218 base pairs 

; TYPE: nucleic acid 

; STRANDEDNESS : single 

; TOPOLOGY: linear 

IMMEDIATE SOURCE: 
; CLONE: pTZgpt-Fls 

US-08-232-463-14 

Query Match 2.8%; Score 78.8; DB 1; Length 7218; 

Best Local Similarity 3.8%; Pred. No. 1.7e-12; 

Matches 14; Conservative 231; Mismatches 123; Indels 0; Gaps 0; 
Qy 1678 GGT AC AGT C AT CGT C C C CTTT AG GACAGT AGAAGGGAC AGC CAAGG GT GGCGGT GAGGAC 1737 



Db 1460 GTTAAAGAGATAGAAGAATTTGGTACRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 14 01 

Qy 1738 TTT GAAGACACATAT GGGGAGTT GGAATT CAAGAATGATGAAACTGTGAAAACCATAAGG 1797 

• . . . . . . • ...... .... ..... .. .... a . ■ ■ • a . .... 

...«• * . . ...... .... ..... .. .... . .a... a .... 

Db 1400 RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 1341 

Qy 1798 GTT AAAAT AGTAGAT GAGGAGGAAT ACGAAAGG CAAGAGAAT TTCT T C AT TGC C CT T GGT 1857 



Db 134 0 RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 1281 

Qy 1858 GAACCGAAAT GGAT GGAACGT GGAATAT C AGAT GT GAC AGAC AG GAAGCT GACT AT GGAA 1917 



Db 1280 RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 1221 

Qy 1918 GAAGAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC CAGTATT GGGT GAACAC C C CAAA 1977 



Db 1220 RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 1161 

Qy 1978 CTAGAAGT CATCATT GAAGAGTC CTATGAGTTCAAGACTACGGTGGACAAACTGAT CAAG 2037 



Db 1160 RRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRRR 1101 



Qy 2038 AAGACAAA 2045 

Db 1100 RRRRRRRR 1093 



RESULT 2 
US-09-701-068-3 

; Sequence 3, Application US/09701068 

; Patent No. 6677506 

; GENERAL INFORMATION : 

; APPLICANT: Galil, Gad et al . 

; TITLE OF INVENTION: DNA CODING FOR A Mg2+/H+ OR Zn2+/H+ EXCHANGER AND 
TRANSGENIC PLANTS 

; TITLE OF INVENTION: EXPRESSING SAME 
; FILE REFERENCE: 01/21317 

; CURRENT APPLICATION NUMBER: US/09/701,068 

; CURRENT FILING DATE: 2001-05-07 

; NUMBER OF SEQ ID NOS : 17 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 3 

LENGTH: 1935 

TYPE: DNA 
; ORGANISM: Arabidopsis thaliana 

FEATURE : 

NAME/ KEY: CDS 

LOCATION: ( 136 )..( 1755 ) 
US-09-701-068-3 

Query Match 2.8%; Score 76.6; DB 4; Length 1935; 

Best Local Similarity 51.3%; Pred. No. 3.1e-12; 

Matches 178; Conservative 0; Mismatches 169; Indels 0; Gaps 0; 



Qy 2174 TCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGT 2233 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1169 TCTGGCATTTACTCCTCGCCCCTTGGAAACTGCTTTTTGCATTTGTGCCCCCCTGCAACA 1228 

Qy 2234 ACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCA 2293 

I I I I I I I I I Ml I III I I I I I I I I I I I II 

Db 1229 TTGCTCACGGTTGGATCGCTTTCATCTGCTCTCTCCTCTTCATCAGTGGAGTAGCCTTTG 1288 

Qy 2294 TCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAG 2353 

II II I I I I I I I I I I I I I I I I I I I I 

Db 1289 TTGT CACAAGATT T ACT GAC CTT AT AAGCT GT GT C ACT GGAATAAACCC AT AT GT GAT AG 1348 

Qy 2354 CTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTG 2413 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1349 CAT T CAC AG C ACT C GCAAGT GGAACTT C AT GGC C AGACT T AGTAGCAAGTAAAAT C GCT G 1408 

Qy 2414 CC CT C C AG GAT GT AT AT GC AGAC GC CT CCATT GG CAAC GT GAC GGGC AGCAAC GC C GT CA 2473 

I I I II I II I I I I I I I I I I I I II I I I I I II I I I I 

Db 1409 CAGAGCGACAACTAAC C GC AGAT T C AGCT ATT GCAAAC AT CAC CT GC AGT AACT C GGT GA 1468 

Qy 2474 ATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I III I I I I I I I I I I I I I I II I I I I I 

Db 1469 ACAT CT AT GT GG GGATT GGAGT T C C GT GGCTGAT AAACACAGT CT AC 1515 



RESULT 3 
US-09-701-068-1 

; Sequence 1, Application US/09701068 

; Patent No. 6677506 

; GENERAL INFORMATION: 

; APPLICANT: Galil, Gad et al . 

; TITLE OF INVENTION: DNA CODING FOR A Mg2+/H+ OR Zn2+/H+ EXCHANGER AND 
TRANSGENIC PLANTS 

; TITLE OF INVENTION: EXPRESSING SAME 
; FILE REFERENCE: 01/21317 

; CURRENT APPLICATION NUMBER: US/09/701, 068 

; CURRENT FILING DATE: 2001-05-07 

; NUMBER OF SEQ ID NOS : 17 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 1 

LENGTH: 1950 

TYPE: DNA 
; ORGANISM: Arabidopsis thaliana 
US-09-701-068-1 

Query Match 2.8%; Score 76.6; DB 4; Length 1950; 

Best Local Similarity 51.3%; Pred. No. 3.2e-12; 

Matches 178; Conservative 0; Mismatches 169; Indels 0; Gaps 0; 



Qy 2174 TCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGT 2233 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1174 TCTGGCATTTACTCCTCGCCCCTTGGAAACTGCTTTTTGCATTTGTGCCCCCCTGCAACA 1233 

Qy 2234 ACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCA 2293 

I I I I I I I I I III I II I I I I I I I I I I I I II 

Db 1234 TTGCTCACGGTTGGATCGCTTTCATCTGCTCTCTCCTCTTCATCAGTGGAGTAGCCTTTG 1293 

Qy 2294 TCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAG 2353 

II II I I MM II I I I I II I II I I I 

Db 1294 T T GT CACAAGAT T TACT GAC CT T AT AAGCT GTGT CACT G GAAT AAAC C CAT AT GT GAT AG 1353 

Qy 2354 CTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTG 2413 

I I I I I I I I I II I I I I I I I I I I II I I I I I I I 

Db 1354 CAT T CACAGC ACT C GCAAGT GGAACT T C AT GGC C AGACT T AGT AGCAAGT AAAAT C GCT G 1413 

Qy 2414 CCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCA 2473 

I I I II Mill I I I I II I II I I I I I I I II I I I I I 
Db 1414 CAGAGC GACAACTAAC CGC AGAT T C AGCT AT T GCAAAC AT CACCT GCAGT AACT C GGT GA 1473 

Qy 2474 ATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I III I I I I II I I I I I II I II II II I 

Db 1474 ACAT CT AT GT G GGGATT GGAGTT C C GT G GCT GAT AAAC AC AGT CT AC 1520 



RESULT 4 

US-08-232-463-14 

; Sequence 14, Application US/08232463 

; Patent No. 5670367 

; GENERAL INFORMATION: 

APPLICANT: DORNER, ■ F. 



APPLICANT: SCHEIFLINGER, F. 
; APPLICANT: FALKNER, F. G. 

TITLE OF INVENTION: RECOMBINANT FOWLPOX VIRUS 
NUMBER OF SEQUENCES: 52 
; CORRESPONDENCE ADDRESS: 

; ADDRESSEE: Foley & Lardner 

STREET: 1800 Diagonal Road, Suite 500 
CITY: Alexandria 
STATE: VA 
COUNTRY: USA 
ZIP: 22313-0299 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.25 
CURRENT APPLICATION DATA: 
; APPLICATION NUMBER: US/ 08/232 , 4 63 

FILING DATE: 
; CLASSIFICATION: 435 

PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US/07/935,313 
FILING DATE: 

APPLICATION NUMBER: EP 91 114 300.6 
FILING DATE: 26-AUG-1991 
ATTORNEY/AGENT INFORMATION: 
NAME: BENT, Stephen A. 
; REGISTRATION NUMBER: 29,768 

REFERENCE/DOCKET NUMBER: 30472/114 IMMU 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (703)836-9300 
TELEFAX: (703)683-4109 
TELEX: 899149 
; INFORMATION FOR SEQ ID NO: 14: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 7218 base pairs 
; TYPE: nucleic acid 

STRANDEDNESS: single 
TOPOLOGY: linear 
IMMEDIATE SOURCE: 
CLONE: pTZgpt-Fls 
US-08-232-463-14 

Query Match 1.9%; Score 51.6; DB 1; Length 7218; 

Best Local Similarity 5.9%; Pred. No. 0.00023; 

Matches 24; Conservative 215; Mismatches 169; Indels 0; Gaps 0; 

Qy 395 CTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTT 454 

.. ..... ... •»•«• . .... ..... * ......•••« 

.. ..... ... . .... ..... * ••...«•••• 

Db 1078 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1137 

Qy 455 T AAT T GAG GTGTGTGGT CAT G G GT T CAT T GCT G GT GAT C T GGGAC CT T CT AC CAT T GT AG 514 

Db 1138 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1197 



Qy 



515 GGAGT GC AGC CT T C AAC ATGTT CAT CAT CATT G GCAT C T GTGT CT AC GT GATCCCAGAC G 574 



Db 1198 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1257 

Qy 575 GAGAGACT CGCAAGAT CAAGCAT C TACGAGT CTT CTT C AT C AC C GCT GCT T GGAGT AT CT 634 

* * I : • : • ■ > • • ».**•*.. • • ••• • »•• 

Db 1258 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1317 

Qy 635 TTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTT 694 

• • • . • • . • * •••• • • • * ■ * ■ • • ...a.*... » • • • • » • • 

• • ••• • ■ • a « . . . • • . • • •»...»... • • • • • » • • 

Db 1318 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYY 1377 

Qy 695 GGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAG 754 

*•••••• ».....•.«•»••••• • • • •»....■ ••• • 

••••••• • • • ••• • 

Db 1378 YYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYYGTA 1437 

Qy 755 AT AAAC GACT GCT CTTCT ACAAAT AC AT GCACAAAAAGT AC C GC ACAG 802 

III I I I I I I I I I I I I I I I I I I I II 

Db 1438 CCAAAT T CTT CT AT CT CT T TAACT ACTT GCAT AGAT AGGT AATT ACAG 14 85 



RESULT 5 

US-09-197-649-7/c 

; Sequence 7, Application US/09197649 

; Patent No. 6194550 

; GENERAL INFORMATION: 

; APPLICANT: Gold, Larry 

; APPLICANT: Tuerk, Craig 

; APPLICANT: Pribnow, David 

; APPLICANT: Smith, Jonathan D. 

; TITLE OF INVENTION : Systematic Polypeptide Evolution by Reverse Translation 
; FILE REFERENCE: NEX02/C1-CON 
; CURRENT APPLICATION NUMBER: US/ 09/ 197 , 64 9 
; CURRENT FILING DATE: 1998-11-23 
; EARLIER APPLICATION NUMBER: 07/829,461 
; EARLIER FILING DATE: 1992-01-31 
; EARLIER APPLICATION NUMBER: 07/739,055 
; EARLIER FILING DATE: 1991-08-01 
; EARLIER APPLICATION NUMBER: 07/561,968 
; EARLIER FILING DATE: 1990-08-02 
; NUMBER OF SEQ ID NOS : 26 
; SOFTWARE: Patentln Ver. 2.0 
; SEQ ID NO 7 
; LENGTH: 390 
TYPE: DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

; OTHER INFORMATION: Description of Artificial Sequence: Sequence 
; OTHER INFORMATION: having a 120 repeat of ACG flanked by fixed 
; OTHER INFORMATION: fragments having Ncol restriction sites. 
US-09-197-649-7 

Query Match 1.8%; Score 50.2; DB 3; Length 390; 

Best Local Similarity 46.0%; Pred. No. 8.4e-05; 

Matches 169; Conservative 0; Mismatches 198; Indels 0; Gaps 0; 

Qy 2238 CCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCAT 2297 

I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 375 CCATGGCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGT 316 



Qy 2298 TGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGT 2357 

I I I I I I I I I I I I I I I II I III III 

Db 315 CGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGT 256 

Qy 2358 TGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCT 2417 

I I I I I I I I I I I III I I I I I I I I I I 

Db 255 CGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGT 196 

Qy 2418 CCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGT 2477 

I III I I I I I I I I I I I I I I I I I I I I I II 

Db 195 CGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGT 136 

Qy 2478 CTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACA 2537 

I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 135 CGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGT 76 

Qy 2538 GGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGC 2597 

I II III I II I I I I I I I I I I I I I I I I I I I I 

Db 75 CGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGTCGT 16 

Qy 2598 ATTTGTC 2604 

I I I I 

Db 15 CGTCGTC 9' 



RESULT 6 

US-09-016-434-1199 

; Sequence 1199, Application US/09016434 

; Patent No. 6500938 

; GENERAL INFORMATION: 

; APPLICANT: Janice Au-Young 

; APPLICANT: Jeffrey J. Seilhamer 

TITLE OF INVENTION: COMPOSITION FOR THE DETECTION OF SIGNALING 
TITLE OF INVENTION: PATHWAY GENE EXPRESSION 
NUMBER OF SEQUENCES: 1490 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: INCYTE PHARMACEUTICALS, INC. 
STREET: 3174 PORTER DRIVE 
CITY: PALO ALTO 
STATE: CALIFORNIA 
; COUNTRY: USA 

; ZIP: 94304 

COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Word Perfect 6.1 for -Windows /MS-DOS 6.2 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 09/ 016, 434 

FILING DATE: HEREWITH 
; CLASSIFICATION: 

PRIOR APPLICATION DATA: 

APPLICATION NUMBER: 

FILING DATE: 

CLASSIFICATION: 
ATTORNEY/AGENT INFORMATION: 



; NAME: Zeller, Karen J. 

REGISTRATION NUMBER: 37,071 

REFERENCE/ DOCKET NUMBER: PA- 00 02 US 
; TELECOMMUNICATION INFORMATION: 

TELEPHONE: (650) 855-0555 

TELEFAX: (650) 845-4166 
; INFORMATION FOR SEQ ID NO: 1199: 
SEQUENCE CHARACTERISTICS: 

LENGTH: 3984 base pairs 

TYPE: nucleic acid 

STRANDEDNESS: single 

TOPOLOGY: linear 
IMMEDIATE SOURCE: 

LIBRARY: GEN BANK 

CLONE: gl81907 
US-09-016-434-1199 

Query Match 1.7%; Score 46.2; DB 4; Length 3984; 

Best Local Similarity 51.7%; Pred. No. 0.0065; 

Matches 105; Conservative 0; Mismatches 98; Indels 0; Gaps 0; 

Qy 2434 GACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGC 2493 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 674 GCCTTCTCCAAGGACATCTTCTCCGTCATCAACTTCTTCAGCTTCTTCAACTGGCTCTGC 733 

Qy 2494 CTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCG 2553 

I I I I I I I I I I I I I I I I I I I II I I II I II I 

Db 734 GTGGCCCTGGCCATCATCGGCATGATCTGGCTGCGCCACAGAAAGCCTGAGCTTGAGCGG 793 

Qy 2554 GCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGC 2613 

II II II II III I I I I I I I I I I I I I I I I I I I I 

Db 794 CCCATCAAGGTGAACCTGGCCCTGCCTGTGTTCTTCATCCTGGCCTGCCTCTTCCTGATC 853 

Qy 2614 GTGCTCTTGTACCGAAGGCGGCC 2636 

I III I I I I I II 
Db 854 GCCGTCTCCTTCTGGAAGACACC 876 



RESULT 7 

US-09-919-172-61 

; Sequence 61, Application US/09919172 

; Patent No. 6673545 

; GENERAL INFORMATION: 

; APPLICANT: Faris, Mary 

; APPLICANT: Turner, Christopher M. 

; TITLE OF INVENTION: PROSTATE CANCER MARKERS 

; FILE REFERENCE: PA- 003 6 US 

; CURRENT APPLICATION NUMBER: US/09/919, 172 

; CURRENT FILING DATE: 2001-07-30 

; PRIOR APPLICATION NUMBER: 60/222,469 

; PRIOR FILING DATE: 2000-07-28 

; NUMBER OF SEQ ID NOS: 102 

SOFTWARE: PERL Program 
; SEQ ID NO 61 
; LENGTH: 4559 

TYPE: DNA 
; ORGANISM: Homo sapiens 



FEATURE : 
; NAME/ KEY : misc_f eature 

; OTHER INFORMATION: Incyte ID No. 6673545 008942.10 
US-09-919-172-61 

Query Match 1.7%; Score 46.2; DB 4; Length 4559; 

Best Local Similarity 51.7%; Pred. No. 0.0071; 

Matches 105; Conservative 0; Mismatches 98; Indels 0; Gaps 0; 

Qy 2434 GACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGC 2493 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1233 GCCTTCTCCAAGGACATCTTCTCCGTCATCAACTTCTTCAGCTTCTTCAACTGGCTCTGC 1292 

Qy 2494 CTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCG 2553 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1293 GTGGCCCTGGCCATCATCGGCATGATCTGGCTGCGCCACAGAAAGCCTGAGCTTGAGCGG 1352 

Qy 2554 GCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGC 2613 

II II II II III I I I I I I I I I I I I I I I I I I I I 

Db 1353 CCCATCAAGGTGAACCTGGCCCTGCCTGTGTTCTTCATCCTGGCCTGCCTCTTCCTGATC 1412 

Qy 2614 GTGCTCTTGTACCGAAGGCGGCC 2636 

I I I I I I I I I II 
Db 1413 GCCGTCTCCTTCTGGAAGACACC 1435 



RESULT 8 
US-09-701-068-4 

; Sequence 4, Application US/09701068 

; Patent No. 6677506 

; GENERAL INFORMATION: 

; APPLICANT: Galil, Gad et al . 

; TITLE OF INVENTION: DNA CODING FOR A Mg2+/H+ OR Zn2+/H+ EXCHANGER AND 
TRANSGENIC PLANTS 

; TITLE OF INVENTION: EXPRESSING SAME 
; FILE REFERENCE: 01/21317 

; CURRENT APPLICATION NUMBER: US/09/701,068 

; CURRENT FILING DATE: 2001-05-07 

; NUMBER OF SEQ ID NOS : 17 

; SOFTWARE: Patentln version 3.0 

; SEQ ID NO 4 

LENGTH: 2803 

TYPE: DNA 
; ORGANISM: Arabidopsis thaliana 
US-09-701-068-4 

Query Match 1.6%; Score 44.8; DB 4; Length 2803; 

Best Local Similarity 52.1%; Pred. No. 0.013; 

Matches 100; Conservative 0; Mismatches 92; Indels 0; Gaps 0; 

Qy 477 GTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTT 536 

III I I I I I I I I I I I II I II I I I I I I I II I III 

Db 950 GTTTTGTCATATAGGTCTTGGTCCTGGAACACTTGTTGGCTCAGCTGCATTTGATCTTTT 1009 

Qy 537 CAT CATCATT GGCAT CT GTGTCTACGTGAT CCCAGACGGAGAGACTCGCAAGATCAAGCA 596 

I I I I I I I I I I I I I III II I I I I I I I I I I I 

Db 1010 C C C CAT C CAC GCT GTTT GT GTC GTT GT GC CAAAAGCTGGAGAACT GAAAAAGATAT C CGA 1069 



Qy 597 TCTACGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATAT 656 

I I I I I I I I I III III I I I I I I I I I I I II I I I I 

Db 1070 CTTAGGTGTTTGGCTAGTTGAGCTCGTATGGTCTTTTTGGGCTTACATCTGGCTATACAT 1129 



Qy 657 GAT T CT GGCAGT 668 

I I I I I II 
Db 1130 AATCCTCGAGGT 1141 



RESULT 9 

US-09-103-840A-2/C 

; Sequence 2, Application US/09103840A 

; Patent No. 6294328 

; GENERAL INFORMATION: 

; APPLICANT: FLEISCHMAN, Robert D. 

; APPLICANT: WHITE, Owen R. 

; APPLICANT: FRASER, Claire M. 

; APPLICANT: VENTER, John C. 

; TITLE OF INVENTION: DNA SEQUENCES FOR STRAIN ANALYSIS IN MYCOBACTERIUM 

; TITLE OF INVENTION: TUBERCULOSIS 

; FILE REFERENCE: 24366-20007.00 

; CURRENT APPLICATION NUMBER: US/09/103, 840A 

; CURRENT FILING DATE: 1998-06-24 

; NUMBER OF SEQ ID NOS : 2 

; SOFTWARE: Patentln Ver. 2,1 

; SEQ ID NO 2 

LENGTH: 4403765 

TYPE: DNA 

; ORGANISM: Mycobacterium tuberculosis 
FEATURE: 

; OTHER INFORMATION: CDC 1551 

; OTHER INFORMATION: "n" bases at various positions throughout the sequence 

OTHER INFORMATION: represent a, t f c or g 
US-09-103-840A-2 



Query Match 1.6%; Score 44.2; DB 3; Length 4403765; 

Best Local Similarity 46.3%; Pred. No. 3; 

Matches 145; Conservative 0; Mismatches 168; Indels 0; Gaps 0; 

Qy 2213 CCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCA 2272 

III I I I I I I III I I I I I I I I I I I I I II I II I 

Db 3929402 CCTCCCTTACCGCCGTTGCCGCCGGCGCCGGCGGCGCCGGCTACGCCGCTGCCGAATCCC 
3929343 

Qy 2273 TCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTG 2332 

I II I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 3929342 GCGCCGCCGCCTTCGCCGCCGTCCCCACCGTCACCGCCTTGGCCGCCGGCGCCGCCCTCG 
3929283 



Qy 2333 GTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATA 2392 

I I I I I I I I I I I II I I I I I I I I I I 

Db 3929282 CTCGCCACGCCTGTCGTTCCGTTCTGGCCGTCACCACCGGCCCCGCCGGTGCCGCCGGTG 
3929223 



Qy 2393 CGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACG 2452 

I II I I II I I I I I I M I I I I I I I I I I I I 



Db 3929222 CCGCCGGCCCCGTTGATGCCGCCGGCGCCGGCGTTGCCGCCGGCCCCGCCTTGGCCGCCT 
3929163 

Qy 2453 TGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCG 2512 

I I I I I I I I I I I I I I I I II I III II I I I I I 

Db 3929162 TGGCCGCCGGCGAAGCCGTTGCCGTCTTGGGAGAGGGCGCCGCTGTCGCCGGCCCCGCCG 
3929103 

Qy 2513 CCATCTACTGGGC 2525 

I I I III 
Db 3929102 TCGCCGCCGCGGC 3929090 



RESULT 10 

US-09-252-991A-9693/C 

; Sequence 9693, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al . 

; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

; TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
; FILE REFERENCE: 107196.136 

; CURRENT APPLICATION NUMBER: US/09/252 , 991A 

; CURRENT FILING DATE: 1999-02-18 

; PRIOR APPLICATION NUMBER: US 60/074,788 

; PRIOR FILING DATE: 1998-02-18 

; PRIOR APPLICATION NUMBER: US 60/094,190 

; PRIOR FILING DATE: 1998-07-27 

; NUMBER OF SEQ ID NOS : 33142 

; SEQ ID NO 9693 

; LENGTH: 1992 

TYPE: DNA 
; ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-9693 

Query Match 1.6%; Score 43.8; DB 4; Length 1992; 

Best Local Similarity 47.5%; Pred. No. 0.021; 

Matches 162; Conservative 0; Mismatches 177; Indels 2; Gaps 1; 

Qy 2372 TTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATG 2431 

I I I I I I I II I I I I I I III I I I I I I I I I I I I I I I I I I I I 
Db 738 TTGGCACAGCTCGGCCTGTTCCGCCTGCTCGCCACGCTGCTGCC — GCCGGACGTACCAG 681 

Qy 2432 CAGACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCG 2491 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 680 CCGGCGGCCTGTTCCCCGCCTTCGCCGGGGTCGCCACCGGCCTGGTATCGCTGGCCGGCT 621 

Qy 2492 GCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGT 2551 

I I II I I I I I I I I I I I I I II I III III 

Db 620 TCGCCCTCCCGCCGCTGGCAGCCCTGGGCCGGGTACCGCCGTTGCGGGTCCTGCGCAGCG 561 

Qy 2552 CGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCA 2611 

I I I I I II I I I I I I I I I I I I 

Db 560 ACCTGCTGCCGGTGCCGATGCGCACCTGGATGGCCTACGCCTGCGCCCTGCTCGCCCTGG 501 



Qy 



2612 GCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCT 2671 



1 1 1 1 1 1 1 1 1 II III 1 1 1 1 1 I III I I I II I 

Db 500 GCCTGATCATGTGGCGGTTGAGTCTCGACCTGAAGCTGACCCTCGCCCTGCTCGGCGGCG 441 

Qy 2672 GCAAGCTCGCCACAACAT GGCT CTTTGT GAGCCT GT GGCT C 2712 

II I I I I I II I I I I I I I I I I I I I I 

Db 44 0 GCCTGGTCGCCACGCTGGTGCTCGGCGCCCTCCTGCTGCTC 400 



RESULT 11 

US-09-252-991A-9558 

Sequence 9558, Application US/09252991A 
Patent No. 6551795 
GENERAL INFORMATION: 
APPLICANT: Marc J. Rubenfield et al . 

TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
FILE REFERENCE: 107196.136 

CURRENT APPLICATION NUMBER: US/09/252 , 991A 
CURRENT FILING DATE: 1999-02-18 
PRIOR APPLICATION NUMBER: US 60/074,788 
PRIOR FILING DATE: 1998-02-18 
PRIOR APPLICATION NUMBER: US 60/094,190 
PRIOR FILING DATE: 1998-07-27 
NUMBER OF SEQ ID NOS : 33142 
SEQ ID NO 9558 
LENGTH: 2658 
TYPE: DNA 

ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-9558 

Query Match 1.6%; Score 43.8; DB 4; Length 2658; 

Best Local Similarity 47.5%; Pred. No. 0.026; 

Matches 162; Conservative 0; Mismatches 177; Indels 2; Gaps 1; 

Qy 2372 TTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATG 2431 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1007 TTGGCACAGCTCGGCCTGTTCCGCCTGCTCGCCACGCTGCTGCC — GC C GGAC GT AC C AG 1064 

Qy 2432 CAGACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCG 2491 

I I I I I I I II III I I I I I I Ml I I II I I 

Db 1065 CCGGCGGCCTGTTCCCCGCCTTCGCCGGGGTCGCCACCGGCCTGGTATCGCTGGCCGGCT 1124 

Qy 2492 GCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGT 2551 

I I I I I II I I I I I I I I I I I I I III III 

Db 1125 TCGCCCTCCCGCCGCTGGCAGCCCTGGGCCGGGTACCGCCGTTGCGGGTCCTGCGCAGCG 1184 

Qy 2552 CGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCA 2611 

I I I I I II I I I I I I I I I I I I 

Db 1185 ACCTGCTGCCGGTGCCGATGCGCACCTGGATGGCCTACGCCTGCGCCCTGCTCGCCCTGG 1244 

Qy 2612 GCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCT 2671 

I I I I I I I I I II III I I I I I I III I I I I I I 

Db 1245 GCCTGATCATGTGGCGGTTGAGTCTCGACCTGAAGCTGACCCTCGCCCTGCTCGGCGGCG 1304 

Qy 2672 GCAAGCTCGCCACAACAT GGCTCTTTGTGAGCCTGTGGCTC 2712 

II I I I I II I I I I I I I I I I I I I I I 



Db 1305 GCCTGGTCGCCACGCTGGTGCTCGGCGCCCTCCTGCTGCTC 1345 



RESULT 12 

US-09-252-991A-9604 

; Sequence 9604, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al . 

; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

; TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
; FILE REFERENCE: 107196.136 

; CURRENT APPLICATION NUMBER: US/09/252, 991A - 

; CURRENT FILING DATE: 1999-02-18 

; PRIOR APPLICATION NUMBER: US 60/074,788 

; PRIOR FILING DATE: 1998-02-18 

; PRIOR APPLICATION NUMBER: US 60/094,190 

; PRIOR FILING DATE: 1998-07-27 

; NUMBER OF SEQ ID NOS : 33142 

; SEQ ID NO 9604 

LENGTH: 2799 

TYPE: DNA 
; ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-9604 

Query Match 1.6%; Score 43.8; DB 4; Length 2799; 

Best Local Similarity 47.5%; Pred. No. 0.027; 

Matches 162; Conservative 0; Mismatches 177; Indels 2; Gaps 1; 



Qy 2372 TTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATG 2431 

I I I I I I I II I I I I I I III I I I I I I I I I I I I I I I I I I I I 
Db 1285 TTGGCACAGCTCGGCCTGTTCCGCCTGCTCGCCACGCTGCTGCC— GCCGGACGTACCAG 1342 

Qy 2432 CAGACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCG 2491 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1343 CCGGCGGCCTGTTCCCCGCCTTCGCCGGGGTCGCCACCGGCCTGGTATCGCTGGCCGGCT 1402 

Qy 2492 GCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGT 2551 

I I II I I I I I I I I I I I I I I I I III III 

Db 1403 TCGCCCTCCCGCCGCTGGCAGCCCTGGGCCGGGTACCGCCGTTGCGGGTCCTGCGCAGCG 1462 

Qy 2552 CGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCA 2611 

I I I I I II I I I I I I I I I I I I 

Db 1463 ACCTGCTGCCGGTGCCGATGCGCACCTGGATGGCCTACGCCTGCGCCCTGCTCGCCCTGG 1522 

Qy 2612 GCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCT 2671 

I I I I I I II I II III I I I I I I III I I I I I I • 

Db 1523 GCCTGATCATGTGGCGGTTGAGTCTCGACCTGAAGCTGACCCTCGCCCTGCTCGGCGGCG 1582 

Qy 2672 GCAAGCTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTC 2712 

II I I I I I I I I I I I I I I I I I I I II 

Db 1583 GCCTGGTCGCCACGCTGGTGCTCGGCGCCCTCCTGCTGCTC 1623 



RESULT 13 

US-09-103-840A-1/C 



; Sequence 1, Application US/09103840A 

; Patent No. 6294328 

; GENERAL INFORMATION: 

; APPLICANT: FLEISCHMAN, Robert D. 

; APPLICANT: WHITE, Owen R. 

; APPLICANT: FRASER, Claire M. 

; APPLICANT: VENTER, John C. 

; TITLE OF INVENTION: DNA SEQUENCES FOR STRAIN ANALYSIS IN MYCOBACTERIUM 
; TITLE OF INVENTION: TUBERCULOSIS 
; FILE REFERENCE: 24366-20007.00 
; CURRENT APPLICATION NUMBER: US/09/103, 840A 
; CURRENT FILING DATE: 1998-06-24 
; NUMBER OF SEQ ID NOS : 2 
; SOFTWARE: Patentln Ver. 2.1 
; SEQ ID NO 1 
; LENGTH: 4411529 
TYPE: DNA 

; ORGANISM: Mycobacterium tuberculosis 

OTHER INFORMATION: H37Rv 
US-09-103-840A-1 



Query Match 1.6%; Score 43.4; DB 3; Length 4411529; 

Best Local Similarity 47.3%; Pred. No. 5.2; 

Matches 131; Conservative 0; Mismatches 146; Indels 0; Gaps 0; 

Qy 2241 CGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGG 2300 

I I I I III II I I I I I I I I I I I I I I I I I I I I I I 

Db 3932453 CGGCCCCGCCGGCCCCGCCGGCGCCGGCGTTACCGCCAGTCCCACCCGCGCCGCCGTCGG 
3932394 



Qy 2301 GGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGT 2360 

II III II I I I I I I I III I I I I I I I I 

Db 3932393 CGCCAATCCCGCTGGCATTATCAGCACCGGAGCCACCCATGCCGCCGGCGCCGCCTTGGC 
3932334 



Qy 2361 TTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCA 2420 

II II I I I I I I I I III I I I I I I I I I I I I I II 

Db 3932333 CGCCGGTGCCGCCGGCACCACCGGAGCCGTTGATGCCGCCGGCAATGGCGTTGCCGCCCT 
3932274 



Qy 2421 G GAT GT AT AT GC AGAC GC CT C CAT T GGCAAC GT GAC G GG C AGCAAC GC C GT C AAT GT CTT 2480 

III I I I I I I I I I III III III 

Db 3932273 GGCCGCCGACGCCGCCGGCCCCGCCAGCGAACCCGGTACCACCGGTTAGACCTGTGCTGG 
3932214 

Qy 2481 CCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATC 2517 

I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3932213 CGGGGGCGTCGGCGCCGGCCGCTCCGGCACCGCCAGC 3932177 



RESULT 14 

US-09-252-991A-5866 

; Sequence 5866, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al. 



; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

; TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
; FILE REFERENCE: 107196.136 

; CURRENT APPLICATION NUMBER: US/09/252 , 991A 

; CURRENT FILING DATE: 1999-02-18 

; PRIOR APPLICATION NUMBER: US 60/074,788 

; PRIOR FILING DATE: 1998-02-18 

; PRIOR APPLICATION NUMBER: US 60/094,190 

; PRIOR FILING DATE: 1998-07-27 

; NUMBER OF SEQ ID NOS : 33142 

; SEQ ID NO 5866 

LENGTH: 660 

TYPE: DNA 
; ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-5866 

Query Match 1.5%; Score 42.2; DB 4; Length 660; 

Best Local Similarity 46.7%; Pred. No. 0.03; 

Matches 134; Conservative 0; Mismatches 153; Indels 0; Gaps 0; 

Qy 2434 GACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGC 2493 

I I I I I I I I I I II I I I I I I I I I I III II II I 

Db 302 GTCGTCGCCCTGGTCATGCTGGTCCGCGGCTTCGCCGACGCGATCATGATGCGCGGCCAA 361 

Qy 2494 CTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCG 2553 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 362 CTGGCCCTGGCCGAAGGCGCCAACCACGGCTACCTGCCGCCGGAGCACTACGACCAGATC 421 

Qy 2554 GCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGC 2613 

I III III I I I I I I I I I I II III I I I 

Db 422 TTCACCGCGCATGGCGTGATCATGATCATCTTCATGGCCATGCCGTTCATGACCGGCCTG 481 

Qy 2614 GTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGC 2673 

II III I II I I I I I Mill II I I II 

Db 4 82 ATGAACCTGGCCGTGCCGCTGCAGATCGGCGCGCGCGACGTGGCGTTCCCCTTCCTCAAC 541 

Qy 2674 AAGCTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACAT 2720 

III I I I I I I I I I I I III I I I I I 

Db 542 TCGCTGAGCTTCTGGCTGCTCGTGGTCAGCGCCATGCTGGTCAACGT 588 



RESULT 15 

US-09-252-991A-5825 

; Sequence 5825, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al . 

; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

; TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
; FILE REFERENCE: 107196.136 

; CURRENT APPLICATION NUMBER: US/09/252, 991A 

; CURRENT FILING DATE: 1999-02-18 

; PRIOR APPLICATION NUMBER: US 60/074,788 

; PRIOR FILING DATE: 1998-02-18 

; PRIOR APPLICATION NUMBER: US 60/094,190 



; PRIOR FILING DATE: 1998-07-27 
; NUMBER OF SEQ ID NOS : 33142 
; SEQ ID NO 5825 
; LENGTH: 1983 

TYPE: DNA 
; ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-5825 

Query Match 1.5%; Score 42.2; DB 4; Length 1983; 

Best Local Similarity 46.7%; Pred. No. 0.063; 

Matches 134; Conservative 0; Mismatches 153; Indels 0; Gaps 0; 

Qy 2434 GACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGC 2493 

I II I I I I I I I I I III I I I I I I I I I I I I I I I 

Db 193 GTCGTCGCCCTGGTCATGCTGGTCCGCGGCTTCGCCGACGCGATCATGATGCGCGGCCAA 252 

Qy 2494 CTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCG 2553 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 253 CT GGC C CT GGC C GAAGGC GC CAAC CAC GG CT AC CT GC C GC CGGAGC ACT AC GAC CAGAT C 312 

Qy 2554 GCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGC 2613 

I III III I I I I I I I I I I II III I I I 

Db 313 T T CAC CGC GCAT GGC GT GAT CAT GAT C AT CT T CAT GGCC AT GC C GT T CAT GAC CGGC CT G 372 

Qy 2614 GTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGC 2673 

II I I I I I I II I I I I I I I I I I I I II 

Db 373 ATGAACCTGGCCGTGCCGCTGCAGATCGGCGCGCGCGACGTGGCGTTCCCCTTCCTCAAC 432 

Qy 2674 AAGCTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACAT 2720 

III I I I I I I I I I I I III I I I I I 

Db 433 TCGCTGAGCTTCTGGCTGCTCGTGGTCAGCGCCATGCTGGTCAACGT 479 



Search completed: June 25, 2004, 15:37:21 
Job time : 228.931 sees 



GenCore version 5.1.6 
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OM nucleic - nucleic search, using sw model 
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(without alignments) 
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Title: 

Perfect score: 
Sequence : 



US-10-054-680-1 
2766 

1 atggcgtggttaaggttgca . 



, gctacatcaaggggttctaa 2766 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



3017426 seqs, 2290544650 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



6034852 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database 



Published_Applications_NA: * 

1: /cgn2_6/ptodata/l/pubpna/US07_PUBCOMB.seq:* 

2: /cgn2_6/ptodata/l/pubpna/PCT_NEW_PUB.seq:* 

3: /cgn2_6/ptodata/l/pubpna/US06_NEW_PUB.seq:* 

4: /cgn2_6/ptodata/l/pubpna/US06_PUBCOMB.seq:* 

5: /cgn2_6/ptodata/l/pubpna/US07_NEW_PUB.seq:* 

6: /cgn2_6/ptodata/l/pubpna/PCTUS_PUBCOMB. seq: * 

7: /cgn2_6/ptodata/l/pubpna/US08_NEW_PUB.seq: * 

8: /cgn2_6/ptodata/l/pubpna/US08_PUBCOMB.seq: * 

9: /cgn2__6/ptodata/l/pubpna/US09A_PUBCOMB.seq: * 
10: / cgn2_6/ptodata / 1/pubpna/US 0 9B_PUBCOMB . seq : 
11: /cgn2_6/ptodata/l/pubpna/US09C_PUBCOMB.seq: 
12 : /cgn2_6/ptodata/l/pubpna/US09_NEW_PUB. seq: * 
13: /cgn2_6/ptodata/l/pubpna/US09_NEW_PUB.seq2: 
14: /cgn2_6/ptodata/l/pubpna/US10A_PUBCOMB.seq: 
15: /cgn2_6/ptodata/l/pubpna/US10B_PUBCOMB. seq: 
16: /cgn2_6/ptodata/l/pubpna/US10C_PUBCOMB.seq: 
17 : / cgn2_6/ptodata/ 1/pubpna/US 10_NEW_PUB. seq: * 
18 : /cgn2_6/ptodata/l/pubpna/US60_NEW_PUB . seq: * 
19: /cgn2_6/ptodata/l/pubpna/US60_PUBCOMB.seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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Seauence 21161 A 
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ALIGNMENTS 



RESULT 1 
US-10-054-680-1 

; Sequence 1, Application US/10054680 
; Publication No. US20020132998A1 
; GENERAL INFORMATION: 



; APPLICANT: Friddle, Carl Johan 
; APPLICANT: Hilbun, Erin 

; TITLE OF INVENTION: No. US20020132998Alel Human Ion Exchanger Proteins and 

Polynucleotides Encoding the 

; TITLE OF INVENTION: Same 

; FILE REFERENCE: LEX-0301-USA 

; CURRENT APPLICATION NUMBER: US/10/054,680 

; CURRENT FILING DATE: 2002-01-22 

; PRIOR APPLICATION NUMBER: US 60/263,384 

; PRIOR FILING DATE: 2001-01-23 

; NUMBER OF SEQ ID NOS : 5 

; SOFTWARE: FastSEQ for Windows Version 4.0 

; SEQ ID NO 1 

; LENGTH: 2766 

; TYPE: DNA 

; ORGANISM: homo sapiens 

US-10-054-680-1 

Query Match 100.0%; Score 2766; DB 14; Length 2766; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 27 66; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 AC AGGG CAGAACAAT GAGT C CT GTT CAGGGT C AT CGGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 AC AGGG CAGAACAAT GAGT C CT GTT CAGGGT CAT CGGACT GCAAGGAGGGT GT CAT C CT G 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 24 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 C CAAT CT GGT AC C CGGAGAAC C CT T C CCT T GGGGACAAGATT G C CAGGGT C ATT GT CT AT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CTATTGAAGT CATCACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T CTATTGAAGT CATCACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

Qy 361 AC C AGC ACAAC C ACT ATT C GGGT CT GGAAT GAAACT GT CT C CAAC CT GAC CCT T AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AC C AGCAC AAC C ACT ATT C G GGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CT T AT GGC C 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 ATT GCT GGT GAT CTG GGAC CTT CTAC CATT GT AGGGAGT GCAGC CTT CAACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I t I I I I I 1 I I I I I I I I I I I I I I I I 

Db 481 ATT GCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTT CAACAT GTTCATC 540 



541 ATCATT GGCAT CT GTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 AT C ATT GGCAT CT GT GT CT AC GT GAT C C CAGAC GGAGAGACT C GCAAGAT CAAGCAT CT A 600 

601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I 
721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

781 AT GCACAAAAAGT AC C GCACAGACAAACAC CGAGGAATT AT CAT AGAGAC AGAGGGT GAC 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 ATGC ACAAAAAGT AC C GCACAGACAAACAC CGAGGAAT TAT CAT AGAGAC AGAGGGT GAC 840 

841 CAC C CT AAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT CC C AT TT T CT AGAT GG GAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 CAC CCT AAGGGCAT T GAGAT GGAT GGGAAAAT GAT GAATT CC CAT TT T CT AGAT GGGAAC 900 

901 CTGGTGCC CCT GGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGAT GAT CCGGATT CTC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C C GC AGAGAGAT GAT C C GGATT CTC 960 

961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AAG GAT CT GAAGC AAAAACAC CCAGAGAAG GACT T AGAT CAGCT GGT GGAGAT G GC CAAT 102 0 

1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TACT AT GCTCTTTCC CAC CAACAGAAGAGCCGCG C CTT CT AC C GT AT C CAAGC C ACT C GT 1080 

1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GC AGCAGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GC AGCAGAACAAGC CAAGAAGG CC 114 0 

1141 T C C AGC AT GAGCGAGGTGCACAC C GAT GAGC CT GAG GACT TT AT TT C CAAGGT CT T CTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T CC AGC AT GAGCGAG GTGCACAC CGAT GAGC CT GAGGACT TT AT TT CCAAGGT CT T CTTT 1200 

1201 GAC C C ATGT T CTT AC CAGT GC CT G GAGAACTGT GGGGCT GT ACT C CT GAC AGT G GT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGT GGT GAGG 12 60 

1261 AAAGGG GGAGACAT GT CAAAGACCAT GT AT GTGGACT ACAAAACAGAGGAT GGT T CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1261 AAAGGG GGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAG GAT GGT T CT GC C 1320 

1321 AAT GCAGGGGCTGACT ATGAGTT CACAGAGGGCACGGT GGTTCT GAAGC CAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AAT GCAGGGGCTGACT AT GAGT T CACAGAGGGCACGGT G GTT CT GAAGC CAGGAGAGAC C 1380 
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1381 C AGAAGGAGTTCT C C GT GGGCAT AATT GAT GAC GACAT TTTT GAGGAGGAT GAACAC T T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CAGAAGGAGT TCT CC GT GGG C ATAAT T GAT GACGACATT T TT GAGGAGGAT GAAC ACTT C 1440 

1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GTTACCAT CTTGGAT GATGACCAT GCAGGCATCTTCACTTTTGAAT GTGATACTATT CAT 1620 

Mill I I I I I I I I I I I MM II I I Ml III II I I I I HIM II I I I I I I I I I I I I II II I 

1561 GT T AC CAT CTTGGAT GAT GAC CAT GCAGGCAT CTT CACT T TT GAAT GTGAT ACTAT T CAT 1620 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

II I I I I M I II M II I II I I I I I I I I M II I I II M II I II I I II I I II I II I II I I I I I 
1621 GT C AGT GAGAGT AT T GGT GTT AT GGAGGT CAAGGT T CT GC GGAC AT CAGGT GCCC G GGGT 1680 

1681 AC AGT CAT C GT C C C CTT T AGGACAGT AGAAGGGAC AGCCAAGGGT GGCGGT GAG GACTTT 1740 

I II I I II II I I I I I II I I I I I II II I II II I I I II II I I I II II I I I I II II I II II I II 
1681 AC AGT CAT C GT C C C CTTT AGGACAGT AGAAGGGACAG C C AAGGGT GG CGGT GAG GACT TT 1740 

1741 GAAGACACATAT GGGGAGTT GGAATTCAAGAATGAT GAAACT GT GAAAACCATAAGGGTT 1800 

I II I II II II I I I I I I I I I I I II II I II II II I I II II II I I I II I I I I I I M II I I I I I 
1741 GAAGACACATAT GGG GAGTT GGAAT T CAAGAAT GAT GAAACT GT GAAAAC C ATAAGGGTT 1800 

1801 AAAATAGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CTT CAT TGCCCTTGGT GAA 1860 

II I II I I II I I I I II I I II II I I II I I I I I II II I I II I II I II I I II II I I I I I I I I I I 
1801 AAAATAGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT T T CTT C ATTGC C CT T G GT GAA 1860 

1861 CC GAAAT GGAT GGAACGT GGAAT AT C AGAT GT GACAGAC AGGAAGCT GACT AT GGAAGAA 1920 

II I I II II II I II II I II I M I II I I II I II I I I II I I II I II II I I II I I II II I I I I I 

1861 CC GAAAT GGAT GGAACGT GGAAT AT C AGAT GT GAC AGAC AGGAAGCT GACT AT GGAAGAA 1920 

1921 GAGGAGGC CAAGAGGAT AG CAGAGAT GGGAAAGCC AGT ATT GGGT GAACAC C CCAAACTA 1980 

II I II I I I I II I I I II II II I II I II II I II I I II II I II I I I I I I II II I II I II I I I I 
1921 GAG GAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC CAGTATT GGGT GAAC ACC C CAAACTA 1980 

1981 GAAGT CAT CATT GAAGAGT CCTAT GAGTT CAAGACTACGGT GGACAAACT GAT CAAGAAG 2040 

I II II I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I II I I II I I I I I I II I II I I I I 
1981 GAAGT CAT CAT T GAAGAGT C CT AT GAGTT CAAGACT AC G GT G GACAAACT GAT CAAGAAG 2040 

2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I II I I II I II I II I I II I II I II II I II I I I I II I I II I I I I I I I I II II I II I I I I 
2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

2101 AC C GT C AGT GCAGCAGG GGAT GAGGAT GAGGAT GAAT CC GGGGAGGAGAG GCT GC C CT CC 2160 

I II I II I I II I II I I I I I II I I II I II I I II II I II I II II I I I I I II I I I I I I II I I I I 
2101 AC C GT C AGT GCAGC AGGGGAT GAGGAT GAGGAT GAAT CC GGGGAGGAGAG GCT GC C CT CC 2160 

2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I t I I I I I I I 1 I I I I I I t I I I t I I I I I I t I I I I I I I t I I I I f I I I I I I I I I I I I I I 1 I 1 
2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 

Db 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

Qy 2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 

Qy 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

Qy 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2640 

Qy 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

Qy 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

Qy 2761 TTCTAA 2766 

I I I I I I 

Db 2761 TTCTAA 2766 



RESULT 2 
US-10-054-680-5 

; Sequence 5, Application US/10054680 
; Publication No. US20020132998A1 
; GENERAL INFORMATION: 
; APPLICANT: Friddle, Carl Johan 
; APPLICANT: Hilbun, Erin 

; TITLE OF INVENTION: No. US20020132998Alel Human Ion Exchanger Proteins and 

Polynucleotides Encoding the 

; TITLE OF INVENTION: Same 

; FILE REFERENCE: LEX-0301-USA 

; CURRENT APPLICATION NUMBER: US/ 10/054 , 680 

; CURRENT FILING DATE: 2002-01-22 

; PRIOR APPLICATION NUMBER: US 60/263,384 

; PRIOR FILING DATE: 2001-01-23 

; NUMBER OF SEQ ID NOS : 5 

; SOFTWARE: FastSEQ for Windows Version 4.0 



; SEQ ID NO 5 

LENGTH: 3812 

TYPE: DNA 
; ORGANISM: homo sapiens 
US-10-054-680-5 

Query Match 100.0%; Score 2766; DB 14; Length 3812; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 2766; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 618 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 677 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 678 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 737 

Qy 121 ACAGGGC AGAAC AAT GAGT C CT GTT C AGGGT CAT C GGACT GCAAGGAGGGT GT C AT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 738 ACAGGGC AGAAC AAT GAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CTG 797 

Qy 181 C CAAT CT GGT AC C C GGAGAACC CTT CC CT T GGGGACAAGAT T GCCAGGGT CATT GT CTAT 240 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 

Db 798 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 857 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 858 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 917 

Qy 301 T CT ATT GAAGT CAT CAC CT CTCAAGAGAG GGAGGT GACAATT AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 918 TCTATT GAAGT CATCACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 977 

Qy 361 AC C AGCACAAC C ACT AT T CGGGT CT GGAAT GAAACT GT CT C CAAC CT GAC C CT T AT GGCC 420 

I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 978 ACC AGCACAAC C ACT AT T C GGGT CT GGAAT GAAACT GT CT C CAAC CT GACC CTT AT GGCC 1037 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1038 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 1097 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1098 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 1157 

Qy 541 AT CATTGGCATCT GTGT CTACGT GATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1158 AT CATT GGCATCT GTGT CTACGT GATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 1217 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1218 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1277 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1278 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1337 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1338 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1397 

781 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CATAGAGACAGAGGGT GAC 840 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1398 AT G CACAAAAAGT AC C GCAC AGACAAACACCGAGGAATT AT CATAGAGACAGAGGGT GAC 1457 

841 CACCCTAAGGGCATTGAGAT GGATGGGAAAATGAT GAATTCCCATTTTCTAGAT GGGAAC 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1458 CAC C CT AAGGGC ATT GAGAT GGAT G GGAAAAT GAT GAATT C CCAT TTT CT AGAT GGGAAC 1517 



901 



960 



CT GGT GCC CCT GGAAGGGAAGGAAGTGGATGAGTC CC GCAGAGAGAT GAT C CGGATT CT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1518 CTGGT GCC CCT GGAAGGGAAGGAAGTGGATGAGTCCC GCAGAGAGAT GATCCGGATT CT C 1577 

961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCT GGTGGAGATGGCCAAT 1020 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I 
1578 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCT GGT GGAGAT GGC CAAT 1637 

1021 TACT AT GCT CT T T CC CAC CAACAGAAGAGCC GC GC CTT CT AC CGT AT CCAAGC C ACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1638 TACT AT GCT CTTT C C CAC CAACAGAAGAGCC GC GC CTT CT AC C GT AT C CAAGC CACT C GT 



1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GC AGCAGAACAAGCCAAGAAGGC C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1698 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGC C 



1697 



1140 



1757 



1141 T C C AGCAT GAGC GAGGT GC AC AC CGAT GAGC CT GAGGACTTT AT TT C CAAGGT CT T CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

1758 T C C AGCAT GAGC GAGGT GCACAC C GAT GAGC CT GAGGACT TT AT T T C CAAGGT CTT CT TT 1817 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1818 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1877 

1261 AAAGGGGGAGAC ATGT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGAT GGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I'M I I I I I I I I I I I I I I I I I I I I I I I I I I 

1878 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAACAGAGGATGGT T CT GCC 1937 

1321 AAT GC AGGG GCT GACT AT GAGTT CACAGAGGGC AC GGTGGT T CT GAAGC C AGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1938 AAT GCAGGGGCT GACTATGAGTT CACAGAGGGCACGGTGGTT CT GAAGC CAGGAGAGACC 1997 

1381 CAGAAGGAGTT CTCCGT GGGCATAATTGATGACGACATTTTT GAGGAGGAT GAACACTTC 144 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1998 CAGAAGGAGTT CTCCGTGGGCATAATTGATGACGACATTTTT GAGGAGGAT GAACACTTC 2057 

1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2058 T TT GTAAGGTT GAGCAAT GT C CGCAT AGAGGAGGAGC AGCC AGAGGAGGG GAT GCCT C C A 2117 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560- 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2118 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 2177 



Qy 1561 GTT AC CAT CT T GGATGAT GACCAT G CAGGC AT CTT CACTT T T GAAT GT GATACT ATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2178 GTTACCATCTT GGATGAT GACCAT GCAGGCAT CTTCACTTTTGAATGTGATACTATTCAT 2237 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2238 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2297 

Qy 1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2298 ACAGT CAT C GT CC C CT TT AGGACAGT AGAAGGGACAGC CAAGGGTGGC GGT GAGGACTT T 2357 

Qy 1741 GAAGACACATATGGGGAGTTGGAATT CAAGAATGAT GAAACTGTGAAAACCATAAGGGTT 1800 

II I I I I I I I I III! I I III I I II II I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2358 GAAGACACATATGGGGAGTTGGAATT CAAGAATGAT GAAACTGTGAAAACCATAAGGGTT 2417 

Qy 1801 AAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGAATTT CTT CATTGCCCTT GGTGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2418 AAAAT AGTAGATGAGGAGGAATACGAAAGGCAAGAGAATTT CTT CATTGCCCTT GGTGAA 2477 

,Qy 1861 C C GAAAT GGAT GGAAC GT GGAAT AT C AGAT GT GAC AGACAGGAAGCT GACT AT GGAAGAA 1920 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2478 C C GAAAT GGAT GGAAC GT GGAAT AT C AGAT GT GAC AGACAGGAAGCT GACT AT GGAAGAA 2537 

Qy 1921 GAGGAGG C CAAGAGGAT AGCAGAGAT GGGAAAGC CAGT ATT GG GTGAACACC C CAAACT A 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I II I I I I I 
Db 2538 GAGGAGGC CAAGAGGAT AGCAGAGAT GGGAAAGC CAGT ATT GGGTGAACAC C C CAAACT A 2597 

Qy 1981 GAAGT CAT CAT T GAAGAGT C CT AT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2040 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 
Db 2598 GAAGT CAT CAT T GAAGAGT C CT AT GAGT T CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2657 

Qy 2041 ACAAAC CT GGC CTT GGTTGTGGGGACCCATTCCTGGAGGGAC CAGT T CAT GGAGGC CATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2658 ACAAAC CT GGC CTT GGTTGTGGGGACCCATTCCTGGAGGGAC CAGT T CAT GGAGGC CATC 2717 

Qy 2101 ACCGTCAGT GCAGCAGGGGATGAGGATGAGGAT GAATCCGGGGAGGAGAGGCTGCCCT C C 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2718 AC CGTC AGT GCAGC AGGGGAT GAGGAT GAGGAT GAAT C C GGGGAGGAGAGGCT GC CCT C C 2777 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2778 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 2837 

Qy 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2838 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2897 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2898 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2957 

Qy 2341 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2400 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2958 GATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCG 3017 

Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2460 



Db 



3018 



I I I I I I I I I I I II I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 3077 



Qy 2461 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 252 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3078 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 3137 

Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3138 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 3197 

Qy 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2640 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3198 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 3257 

Qy 2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3258 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 3317 

Qy 2701 AGCCT GT GGCT C CT CT AC AT ACT CT TTGC CACACTAGAGG C CT ATT G CT ACAT CAAGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3318 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 3377 

Qy 2761 TTCTAA 2766 

I I I I I I 

Db 3378 TTCTAA 3383 



RESULT 3 

US-09-804-474A-1 

; Sequence 1, Application US/09804474A 

; Patent No. US20020119518A1 

; GENERAL INFORMATION: 

; APPLICANT: KODET, Stefan et al 

; TITLE OF INVENTION: ISOLATED HUMAN TRANSPORTER PROTEINS, 

; TITLE OF INVENTION: NUCLEIC ACID MOLECULES ENCODING HUMAN TRANSPORTER 
PROTEINS, 

; TITLE OF INVENTION: AND USES THEREOF 

FILE REFERENCE: CL000891 
; CURRENT APPLICATION NUMBER: US/09/804 , 474A 
; CURRENT FILING DATE: 2001-03-13 
; NUMBER OF SEQ ID NOS : 4 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 1 

LENGTH: 2782 

TYPE: DNA 

ORGANISM: Human 
US-09-804-474A-1 



Query Match 99.8%; Score 2761.2; DB 9; Length 2782; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2763; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 69 



Qy 

Db 



61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
70 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 129 



Qy 121 AC AGGGC AGAAC AAT GAGT C CT GTT CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I 

Db 130 AC AGGGCAGAAC AAT GAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CTG 189 

Qy 181 C CAAT CTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGC CAGGGT CATTGTCT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 190 C CAAT CT GGT AC C C GGAGAAC CCTTCCCTT GGGGACAAGATT GC CAGGGT CAT T GT CT AT 24 9 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I III I I I I I I I II III I II III II I II I II III I I I I I I I I III II III I I III II 

Db 250 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 309 

Qy 301 T CTATTGAAGT CATCACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 310 T CTATTGAAGTCATCACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 369 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 370 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 489 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACAT GTT CATC 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 490 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 549 

Qy 541 AT CATTGGCATCT GT GTCTACGT GATCCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 550 AT CATTGGCATCT GT GTCTACGT GAT CCCAGACGGAGAGACTCGCAAGAT CAAGCAT CTA 609 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 610 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I 

Db 670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 789 

Qy 781 AT GCACAAAAAGT ACCGC ACAGACAAAC AC C GAGGAATT AT CATAGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 790 AT GCACAAAAAGT ACCGC ACAGACAAAC ACC GAGGAATT AT CATAGAGACAGAGGGT GAC 84 9 

Qy 841 C AC C CTAAGGGCAT T GAGAT GGAT GGGAAAATGAT GAAT T C C CAT TTT CT AGAT GG GAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 850 C AC C CTAAGGG CATT GAGAT GGAT GG GAAAAT GAT GAAT T CC CATTT T CT AGAT GG GAAC 909 

Qy 901 CT GGTG C CC CT G GAAGGGAAGGAAGT GGAT GAGT CC CG CAGAGAGAT GAT CCGGAT T CT C 960 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M I 1 1 1 1 1 1 1 ill 

910 CT GGT GCC CCT GGAAGGGAAGGAAGTGGAT GAGT C CCGC AGAGAGAT GAT CC GGAT C CT C 



969 



961 AAGGAT CT GAAGCAAAAAC AC C C AGAGAAGGACTTAGAT CAGCT GGT GGAGAT G GCCAAT 1020 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
970 AAGGAT CT GAAGCAAAAAC AC C C AGAGAAGGACT T AGAT CAGCT GGT GGAGAT G GC CAAT 1029 

1021 TACT AT GCT CT TT C C CAC CAACAGAAGAGCCGC GC CTT CTAC C GT AT C CAAG CC ACT C GT 1080 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1030 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1089 

1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAAC AT GC AGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1090 AT GAT GACT GGT GCAGGCAAT AT CCT GAAGAAAC ATGCAGCAGAACAAG CCAAGAAGGC C 1149 

1141 T CCAGCAT GAG C GAGGT GC ACAC C GAT GAGC CT GAGGACT TT AT T TC CAAGGT CT T CT T T 1200 

I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1150 T CCAGCAT GAGCGAGGT GC ACAC C GAT GAGCCT GAGGACTTT ATT TC CAAGGT CT T CTT T 1209 

1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1210 GAC C CATGT T CTT AC C AGT GC CT GGAGAACT GT GGGGCT GTACT C CT GACAGT GGT GAGG 1269 

1261 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1270 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACT ACAAAAC AGAGGATG GTT CT GCC 1329 

1321 AAT GCAGGGGCTGACTATGAGTT CACAGAGGGCACGGTGGTT CT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1330 AAT GCAGGGGCTGACT ATGAGTT CACAGAGGGCACGGT GGTT CT GAAGCCAGGAGAGACC 1389 

1381 C AGAAGGAGT T CT CC GT GGG CATAATT GAT GACGACATT T TT GAGGAGGAT GAACACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1390 C AGAAGGAGT T CT CC GTGGGC ATAAT T GAT GACGACATT T TT GAGGAGGAT GAACACT T C 1449 

1441 TTTGTAAGGTTGAGCAATGT CCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT CCA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
1450 TTT GTAAGGT T GAGC AAT GT C CGC ATAGAGGAGGAGC AG C CAGAGGAGGGGAT GC CT C C A 1509 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1569 

1561 GTTACCATCTTGGAT GATGACCAT GCAGGCAT CTT CACTTTTGAATGT GATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1570 GTTACCATCTTGGAT GATGACCATGCAGGCAT CTT CACTTTTGAATGT GATACTATTCAT 1629 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1630 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1689 

1681 ACAGT CAT C GT CC C CT TT AGGACAGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACT T T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1690 ACAGTCATCGTCCCCTTT AGGACAGT AGAAGGGACAGCCAAGGGTGGCGGT GAGGACTTT 1749 

1741 GAAGACACAT AT G G GGAGTT GGAATT CAAGAAT GATGAAACT GT GAAAAC C AT AAGGGT T 1800 
I I 1 1 I I [ I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1750 GAAGACACATAT GGGGAGTTGGAATT CAAGAATGATGAAACTGT GAAAACCATAAGGGTT 1809 

Qy 1801 AAAATAGTAGATGAGGAGGAATACGAAAGGCAAGAGAATTT CTT CATT GCCCTT GGTGAA 1860 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1810 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAATT T CTT CATT GCCCTT GGT GAA 1869 

Qy 1861 CCGAAAT GGATGGAACGTGGAATATCAGATGT GACAGACAGGAAGCTGACTAT GGAAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1870 CCGAAAT GGAT GGAAC GT GGAAT AT C AGAT GT GACAGACAGGAAGCT GACT AT GGAAGAA 1929 

Qy 1921 GAGGAGGCCAAGAGGATAGCAGAGAT GGGAAAGCCAGTATT GGGTGAACACCC CAAACTA 198 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1930 GAGGAGGCCAAGAGGATAGCAGAGAT GGGAAAGCCAGTATT GGGTGAACACCCCAAACT G 1989 

Qy 1981 GAAGT CAT CAT T GAAGAGT CCT AT GAGT T CAAGACT AC GGT GGACAAACT GAT CAAGAAG 204 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1990 GAAGT CAT CATT GAAGAGT CCT AT GAGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAG 2049 

Qy 2041 ACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2050 ACAAAC CT GGC CT T GGT T GT GGGGAC CC ATT C CT GGAGGGAC C AGT T CAT GGAGGC CAT C 2109 

Qy 2101 ACCGT CAGTGCAGCAGGGGATGAGGATGAGGATGAAT CCGGGGAGGAGAGGCT GCCCT C C 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2110 ACCGT CAGTGCAGCAGGGGATGAGGATGAGGATGAAT CCGGGGAGGAGAGGCTGCCCTCC 2169 

Qy 2161 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2170 TGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTG 222 9 

Qy 2221 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2230 CCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGC 2289 

Qy 2281 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2290 ATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAA 234 9 

Qy 2341 GATT CAGT CAC AGCT GT TGTTTTCGT GGC AT TT GGCAC CT CT GT CC CAGAT AC GT T T G C C 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2350 GATTCGGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCC 2409 

Qy 2401 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2410 AGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGC 2469 

Qy 24 61 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2520 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2470 AGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTAC 2529 

Qy 2521 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2580 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2530 TGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACC 2589 

Qy 2581 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2640 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2590 CTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCAC 2649 



Qy 

Db 



2641 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I 
2650 CTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTG 2709 



Qy 2701 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2710 AGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGG 2769 

Qy 2761 TTCTAA 2766 

I I I I I I 

Db 2770 TTCTAA 2775 



RESULT 4 
US-10-275-116-1 

Sequence 1, Application US/10275116 
Publication No. US20030096312A1 
GENERAL INFORMATION: 
APPLICANT: Merck Patent GmbH 

TITLE OF INVENTION: No. US20030096312Alel natrium-calium exchanger protein 
FILE REFERENCE: HNCX3CWWS 

CURRENT APPLICATION NUMBER: US/10/275,116 
CURRENT FILING DATE: 2002-11-01 
NUMBER OF SEQ ID NOS : 2 \ 
SOFTWARE: Patentln Ver. 2.1 A 
SEQ ID NO 1 
LENGTH: 2781 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (1) . . (2781) 
US-10-275-116-1 

Query Match 98.8%; Score 2733.4; DB 15; Length 2781; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 2762; Conservative 0; Mismatches 1; Indels 18; Gaps 1; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAAT GAGT CCTGTT CAGGGTCAT CGGACT GCAAGGAGGGTGTCATCCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ACAGGGCAGAACAAT GAGT C CT GTT CAGGGTCAT CGGACT GCAAGGAGGGT GT C AT CCT G 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I II I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 TCTATTGAAGTCAT CACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 TCTATTGAAGT CAT CACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 42 0 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

Qy 481 AT T GCT G GT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT GCAGC CT T CAACAT GT T CATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I 

Db 481 AT T GCT G GT GAT CT GGGAC CTT CT AC CAT T GT AGGGAGT GCAGC CT T CAACAT GT T CATC 540 

Qy 541 AT CATTGGCATCT GT GT CTACGT GAT CCCAGACGGAGAGACT CGCAAGATCAAGCAT CTA 600 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 AT CATTGGCATCT GT GTCTACGT GAT CC CAGACGGAGAGACT CGCAAGATCAAGCATCTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GCACAAAAAGT ACCGCAC AGACAAACAC C GAG GAAT TAT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 AT GCACAAAAAGT ACC GC AC AGACAAACAC CGAGGAATT AT C AT AGAGAC AGAG GGT GAC 840 

Qy 841 CAC C CTAAGGGCAT T GAGAT GGAT GG GAAAATGAT GAATT C C CAT TT T CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 C AC CCTAAGGGCAT T GAGAT G GAT GGGAAAAT GAT GAAT T C C CATTT T CT AGAT GGGAAC 900 

Qy 901 CT GGT GCC C CT GGAAGGGAAGGAAGT GGAT GAGT CC CGC AGAGAGAT GAT C C GGATT CT C 960 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 CTGGTGCC C CTGGAAGGGAAGGAAGT GGAT GAGT CC C GC AGAGAGAT GAT C C GGAT T CTC 960 

Qy 961 AAG GAT CT GAAGCAAAAAC AC C C AGAGAAGGACTT AGAT CAGCT GGT GGAG AT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 AAGGAT CT GAAGCAAAAAC AC C C AGAGAAGGACTT AGAT CAGCT G GT GGAG AT GGC CAAT 1020 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGTGCCTTCTACCGTATCCAAGCCACTCGT 1080 

Qy 1081 AT GAT GACT GGT GC AGGCAAT AT C CT GAAGAAACAT GCAGC AGAACAAGC CAAGAAG GCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 AT GAT GACT GGT GCAGG CAAT AT C CT GAAGAAACAT GCAGC AGAACAAGC CAAGAAG GCC 1140 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1200 



1260 



1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I 
1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

1261 AAAGGGGGAGACAT GT CAAAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 AAAGGG GGAGACAT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGT T CT GC C 1320 

1321 AAT GCAGGGG CT GACT AT GAGT T CACAGAGGGCACGGT GGT T CT GAAGCC AGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AAT GC AGG GGCT GACT AT GAGT T CACAGAGGGCAC GGT GGTT CT GAAG C C AGGAGAGAC C 1380 

1381 CAGAAGGAGTT CTCCGTGGGCATAATTGATGACGACATTTTT GAGGAGGATGAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CAGAAGGAGTT CTCCGTGGGCATAATTGATGACGACATTTTT GAGGAGGATGAACACTT C 1440 

1441 T TT GTAAGGT T GAGCAAT GTC CGCAT AGAGGAGGAGCAGCC AGAGGAGGGGAT GCCTCC A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I 
1441 TTTGTAAGGTT GAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GC CTCCA 1500 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

1561 GTT AC CAT CT T GGAT GAT GACCAT GCAGGCAT CT T C ACTT TT GAAT GT GAT ACT ATTC AT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 GTT AC CAT CT T GGAT GAT GACCAT GCAGGCAT CTT C ACTT TT GAAT GT GATACT ATT C AT 1620 

1621 GT CAGT GAGAGTAT TGGT GTTAT GGAGGT CAAGGTT CT GC GGACAT C AGGTG CCCGGG GT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GT CAGT GAGAGTAT TGGT GT TAT GGAGGT CAAGGTT CT GC GGACAT C AGGT GCC C GGGGT 1680 

1681 ACAGT CAT CGT C C C CT T T AGGAC AGT AGAAG GGACAGC CAAGGGTGGCGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1681 ACAGT CAT CGT C C C CT T T AGGAC AGT AGAAGGGACAGC CAAGGGTGGC GGT GAGGACTTT 1740 

1741 GAAGACAC AT AT GG GGAGTT GGAAT T CAAGAATGAT GAAACT GT GAAAACCATAAGGGT T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1741 GAAGACACATAT GGGGAGTTGGAATT CAAGAATGAT GAAACTGT GAAAACCATAAGGGTT 1800 

1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAGGCAAGAGAATT T CTT CAT TGCCCTTGGT GAA 1860 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 AAAAT AGT AGAT GAGGAGGAAT AC GAAAG GCAAGAGAATT T CT T CAT TGCCCTTGGT GAA 1860 

1861 C C GAAAT G GAT G G AAC G T G GAAT AT C AGAT GT GAC AGACAGG 1902 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 C CGAAAT GGAT GGAAC GT G GAAT AT C AGGT GTGAGAT T CTTTAAAGAT GT GAC AGACAGG 1920 

1903 AAGCT GACTAT GGAAGAAGAGGAGGCCAAGAGGATAGCAGAGATGGGAAAGCCAGTATTG 1962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 AAGCT GACTAT G GAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGC CAGT ATT G 1980 



Qy 1963 GGTGAACACCCCAAACTAGAAGTCATCATTGAAGAGTCCTATGAGTT CAAGACTACGGT G 2022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1981 G GT GAACAC C C CAAACTAGAAGT CAT CAT T GAAGAGT C CT AT GAGT T CAAGACT AC GGT G 2040 



Qy 2023 GACAAACTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGAC 2082 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 GACAAACTGAT CAAGAAGACAAACCTGGCCTTGGTT GT GGGGACCCATT CCT GGAGGGAC 2100 

Qy 2083 C AGTT CATGGAGGCC AT C ACC GT C AGT GC AGCAGGGGAT GAGGAT GAGGAT GAAT C CGGG 2142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 2101 CAGTT CATGGAGGCCATCACCGT CAGTGC AGCAGGGGAT GAGGAT GAGGAT GAAT CCGGG 2160 

Qy 2143 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 2202 

II II I I I I I III I II I II I I I I I I I I I I I III Mill II III I I I II I I III I I III I I I 

Db 2161 GAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAG 222 0 

Qy 2203 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 2262 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2221 GTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTC 2280 

Qy 2263 TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 2322 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 TCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGC 234 0 

Qy 2323 TGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCT 2382 

I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2341 TGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCT 2400 

Qy 2383 GT C CCAGAT AC GTT T GCCAGCAAAGCT GCT GC C CT C CAGGAT GTAT AT G CAGAC GC CT C C 2442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2401 GT C CCAGAT AC GTT T GC CAGCAAAGCT GCT GC C CT C CAGGAT GTAT AT G CAGAC GC CT C C 2460 

Qy 2443 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 2502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 ATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGG 2520 

Qy 2503 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 2562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 TCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACA 2580 

Qy 2563 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 2622 

I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I II I I I I I I I I II I II I I I I I I I I I I I I 
Db 2581 CTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTG 264 0 

Qy 2623 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 2682 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2641 TACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCC 2700 

Qy 2683 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 2742 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2701 ACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCC 2760 

Qy 2743 TATTGCTACATCAAGGGGTTC 2763 

I I I I I I I I I I I I I I I I I I I I I 
Db 2761 TATTGCTACATCAAGGGGTTC 2781 



{/RES 
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US-10-114-153-5 

Query Match 96.6%; Score 2673.2; DB 15; Length 2685; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2675; Conservative 0; Mismatches 3; Indels 0; Gaps 0 

Qy 86 GAGCAGAGGCT GGT GGCT CAGGGGACGT GCCAAGCACAGGGCAGAACAAT GAGT CCT GTT 145 

II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 GATCCGAGGCT GGT GGCT CAGGGGACGTGCCAAGCACAGGGCAGAACAAT GAGT CCTGTT 61 

Qy 146 C AGGGT CATCGGACT GCAAG GAGGGT GT CAT C CT GC CAATCT GGT AC C C GGAGAAC C CT T 205 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 62 C AGG GT CAT C GGACT GCAAGGAGGGT GT CAT C CT GC CAAT CT GGT AC C C GGAGAAC C CT T 121 

Qy 206 C CCTT G GGGACAAGAT T GC C AGGGT CAT T GT CT ATT T T GT GGC CCT GAT AT ACAT GT T C C 2 65 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 122 CCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCC 181 

Qy 266 T T GGGGT GT CC AT CAT T GCT GAC C GCTT CAT GGCAT CT ATT GAAGT CAT C AC CT CT CAAG 325 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 182 T T GGGGT GT C CAT CAT T GCT GAC C GCTT CAT GGCAT CT ATT GAAGT CAT CAC CT CT CAAG 241 

Qy 32 6 AGAGGGAGGTGACAATT AAGAAAC C CAAT GGAGAAAC C AGCACAACCACT AT T C GGGT CT 385 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 242 AGAGGGAGGT GACAATT AAGAAAC C CAAT GGAGAAAC C AGCACAAC CAC TAT T C GGGT CT 301 

Qy 386 GGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATAC 445 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 302 GGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATAC 3 61 

Qy 44 6 TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 505 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 362 TCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTA 421 

Qy 506 C C ATT GT AGGGAGT GCAGC CT T CAAC AT GTT CAT CATCATT GGCAT CT GT GT CT AC GT GA 565 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 422 C C ATT GT AGGGAGT GCAGC CT T CAACAT GTT CAT CAT C ATT GGCAT CT GT GT CT AC GT GA 4 81 

Qy 566 TCCCAGACGGAGAGACTCGCAAGATCAAGCATCTACGAGTCTTCTTCATCACCGCTGCTT 625 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 482 T C C C AGACGGAGAGACT C G CAAGAT CAAAC AT CT AC GAGTCTTCTT CAT CAC C GCT GCT T 541 



Qy 626 
Db 542 



GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 685 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
GGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGG 601 



Qy 

Db 



686 TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 745 

I I I I I I I I I I I I I I I I I I II I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
602 TCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCT 661 



Qy 746 G GGT GGCAGAT AAACGACT GCT CTT CT ACAAAT ACAT GCACAAAAAGT AC C GCACAGAC A 805 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 662 GGGT GGCAGAT AAAC GACT GCT CT T CT ACAAAT AC AT GCACAAAAAGT ACC GCACAGACA 721 

Qy 806 AAC ACC GAGGAATT AT C AT AGAGACAGAGGGT GACC AC C CTAAGGGCAT T GAGAT GGAT G 865 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 722 AAC ACC GAGGAATT AT CAT AGAGACAGAGGGT GACC AC C CTAAGGGCAT T GAGAT GGAT G 781 

Qy 866 GGAAAAT GAT GAAT T C CC AT T TT CT AGAT GGGAACCT GGTGCCCCT GGAAG GGAAG GAAG 925 

I I II I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 82 GGAAAAT GAT GAAT T C CC ATTTT CT AGAT GGGAACCT GGTGCCCCT GGAAG G GAAGGAAG 841 

Qy 926 T GGAT GAGTC C C GCAGAGAGATGAT CCGGATT CT CAAGGAT CTGAAGCAAAAACAC CC AG 985 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 842 TGGAT GAGT C C C GCAGAGAGATGAT CCGGATT CT CAAGGAT CT GAAGCAAAAACAC CC AG 901 

Qy 986 AGAAGGACT TAG AT C AGCT GGT GGAGAT GGCCAATT ACT AT GCT CTT T C C CACC AAC AGA 1045 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 902 AGAAG GACT T AGAT CAGCT GGTGGAGATGGCCAATTACT ATGCTCTTTC CCACCAACAGA 961 

Qy 1046 AGAGC C GCGC CT TCT ACCGT AT C CAAGC C ACT C GT AT GAT GACT GGT GC AGGCAAT AT C C 1105 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 962 AGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGTATGATGACTGGTGCAGGCAATATCC 1021 

Qy 1106 TGAAGAAACATGCAGCAGAACAAGCCAAGAAGGCCT CCAGCATGAGCGAGGT GCACACCG 1165 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I II I 
Db 1022 T GAAGAAACAT GCAGC AGAACAAGCCAAGAAGGC CT C CAGC AT GAGC GAGGT GC ACACC G 1081 

Qy 1166 ATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTACCAGTGCCTGG 1225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1082 AT GAGC CT GAGGACT T T ATT T CCAAGGT CT T CTTTGAC C CAT GTT CT TACCAGT GC CT G G 1141 

Qy 1226 AGAACT GT GGGGCT GT ACT C CTGAC AGT GGT GAGGAAAGGGGGAGAC AT GT CAAAGAC C A 1285 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1142 AGAACT GTGGGGCTGTACTCCTGACAGT GGT GAGGAAAGGGGGAGACATGT CAAAGAC CA 1201 

Qy 1286 T GT ATGT GGACTACAAAACAGAGGATGGTTCT GCCAATGCAGGGGCT GACTATGAGTTCA 1345 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1202 TGTATGT GGACTACAAAACAGAGGATGGTTCT GCCAAT GCAGGGGCT GACTATGAGTT CA 1261 

Qy 1346 C AGAGGGCAC GGT G GT T CT GAAGC CAGGAGAGAC CCAGAAG GAGT T CT C C GT GGGCAT AA 1405 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1262 C AGAGGGCAC GGT G GT T CT GAAGC CAGGAGAGAC CCAGAAGGAGT T CT CC GT GGG CAT AA 1321 

Qy 1406 TT GAT GACGAC ATT T T T GAGG AGGAT GAACACT T CT T T GTAAGGT T GAGCAATGT CC GCA 1465 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1322 TT GAT GACGAC ATT TT T GAGGAGGAT GAACACT T CT T T GTAAGGT T GAGCAATGT C C GCA 1381 

Qy 1466 T AGAGGAGGAGC AGC C AGAGGAGGGG AT GCCT C C AGCAAT AT T CAAC AGT CT TC C CTT G C 1525 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1382 T AGAGGAGGAG C AGCC AGAGGAG GGGAT GCCT C C AGCAAT AT T CAAC AGT CT TC C CTT GC 1441 

Qy 1526 CTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATG 1585 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1442 CTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGATGATGACCATG 1501 

Qy 1586 CAGGC AT CTT CACTTT T GAAT GT GAT ACT ATT CAT GT C AGT GAGAGT ATT GGT GTT AT GG 1645 

I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1502 CAGGC AT CTT CACTTT T GAAT GT GAT ACT ATT CAT GTC AGT GAGAGT ATT GGT GTT AT GG 1561 

Qy 1646 AGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCCTTTAGGACAG 17 05 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1562 AGGT CAAGGTT CT GCGGACAT C AG GT GC C CGGGGT ACAGT CAT C GT CC C CTT T AGGAC AG 1621 

Qy 1706 TAGAAGGGAC AGC CAAGGGT GGC GGT GAGGACTTT GAAGACAC AT AT GGGGAGT T G GAAT 1765 

I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1622 TAGAAGGGAC AGC CAAGGGT GGC GGT GAGGACTT T GAAGACACAT AT G GGGAGTT G GAAT 1681 

Qy 1766 T CAAGAAT GAT GAAACT GT GAAAACC AT AAG GGT TAAAAT AGT AGAT GAGGAGGAATACG 1825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1682 T CAAGAAT GAT GAAACT GT GAAAACCATAAGGGT TAAAAT AGT AGAT GAGGAGGAATAC G 1741 

Qy 1826 AAAGGCAAGAGAAT TT CT T CAT T GC C CTT GGT GAAC C GAAAT GGAT GGAACGT GGAAT AT 1885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1742 AAAGGCAAGAGAAT TT CT T CAT T GC CCT T GGT GAAC CGAAAT GGAT GGAACGT GGAAT AT 1801 

Qy 1886 CAGATGTGACAGACAGGAAGCTGACTATGGAAGAAGAGGAGGCCAAGAGGATAGCAGAGA 1945 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I II 
Db 1802 C AGAT GT GACAGACAG GAAGCT GACT AT GGAAGAAGAGGAGGC CAAGAGGATAGCAGAGA 1861 

Qy 1946 T GGGAAAGCCAGTATT GGGTGAACACCCCAAACT AGAAGTCAT CATTGAAGAGTCCTATG 2005 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1862 T GGGAAAGCCAGTATT GGGT GAACACCCCAAACT AGAAGTCAT CATTGAAGAGTCCTATG 1921 

Qy 2006 AGTT CAAGACT AC GGT GGACAAACT GAT CAAGAAGACAAAC CT GGC CTT GGT T GT GGGGA 2065 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1922 AGTTCAAGACTACGGTGGACAAACTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGA 1981 

Qy 2066 CCCATTCCTGGAGGGACCAGTTCATGGAGGCCATCACCGTCAGTGCAGCAGGGGATGAGG 2125 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1982 C C CATT C CTGGAGGGAC C AGTT CAT GGAGGC CAT CAC CGT C AGT GC AGC AGGGGAT GAGG 2041 

Qy 2126 AT GAGGAT GAAT C C GGGGAGGAGAG GCT GCC CTC CT GCTTT GACT AC GT C AT GC ACTT C C 2185 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2042 AT GAGGAT GAAT C C GG GGAGGAGAG GCT GC C CTC CT G CTTT GAC T AC GT C AT GC ACTT C C 2101 

Qy 2186 TGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCT 2245 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2102 TGACTGTCTTCTGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCT 2161 

Qy 2246 GGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACC 2305 

I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2162 GGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACC 2221 

Qy 2306 TGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCG 2365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2222 TGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCG 2281 

Qy 2366 TGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATG 2425 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



2282 TGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATG 



2341 



Qy 

Db 

Qy 

Db 

Qy 
Db 



2426 TATATGCAGACGCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGG 2485 

I I I I I I I I I I I I! I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2342 TAT AT GCAGAC G C CT C CAT T GG CAAC GTGAC G GGC AGCAACGC C GT CAAT GT CTT C CT GG 24 01 

2486 GCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCC 2545 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2402 GCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCC 24 61 

2546 ACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCT 2605 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2462 ACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCT 2521 



Qy 



Db 



2606 GCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCC 2665 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2522 GCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCC 2581 



Qy 2666 GTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCT 2725 

I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2582 GTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCT 2641 

Qy 2726 TTGCCACACTAGAGGCCTATTGCTACATCAAGGGGTTC 2763 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2642 TTGCCACACTAGAGGCCTATTGCTACATCAAGGGGTTC 2679 



\/RE 
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Query Match 96.1%; Score 2657.6; DB 15; Length 2840; 

Best Local Similarity 97.6%; Pred. No. 0; 

Matches 2712; Conservative 0; Mismatches 54; Indels 12; Gaps 1 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I II I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 63 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 122 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 123 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 182 

Qy 121 ACAGGGCAGAACAAT GAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAGG GT GT CAT C CT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 183 ACAG GGCAGAACAAT GAGT CCT GT T C AGGGT CAT C GGACT GCAAGGAG G GT GT CAT C CT G 242 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II I 

Db 243 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 302 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 303 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 362 

Qy 301 TCTATTGAAGTCAT CACCT CT CAAGAGAGGGAGGTGACAATTAAGAAACC CAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 363 T CT AT T GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC C CAAT GGAGAA 422 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 423 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 482 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 483 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 542 

Qy 481 AT TG CT GGT GAT CT GGGAC CTT CT ACC ATT GT AGGGAGT G CAGC CTT CAACAT GT TC AT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 543 AT TGCT GGT GAT CT GGGAC CTT CT ACC ATTGT AGGGAGT GCAGC CTT CAACAT GTTCAT C 602 

Qy 541 AT CATT GGCATCTGTGTCTACGT GATCCCAGACGGAGAGACTCGCAAGATCAAGCAT CTA 600 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 603 AT CATT GGC AT CT GT GT CT ACGT GATC C C AGAC GGAGAGACT C GCAAGAT CAAGC AT CTA 662 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I 1. 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 663 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 722 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I 
Db 723 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 782 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 783 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 842 

Qy 781 AT GCACAAAAAGT AC C GCACAGACAAAC AC C GAGGAAT T ATC AT AGAGAC AGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 84 3 AT GCACAAAAAGT ACC GCACAGACAAAC AC C GAGGAAT TAT CAT AGAGAC AGAGGGT GAC 902 

Qy 841 CACCCTAAGGGCATT GAGAT GGAT GGGAAAATGATGAATTCCCATTTT CTAGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 903 C ACCCTAAGGGC AT T GAGAT GGAT GGGAAAAT GAT GAAT T CC C ATTT T CTAGAT GGGAAC 962 

Qy 901 CT GGT GCC C CT GGAAGGGAAGGAAGTGGAT GAGT CC CGC AGAGAGAT GAT C C G GATT CT C 960 

I II I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 963 CT GGT GCCC CT GGAAGGGAAGGAAGTGGAT GAGT CC CG CAGAGAGAT GAT CCG GATT CT C 1022 

Qy 961 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGTGGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1023 AAGGATCT GAAGCAAAAACACCCAGAGAAGGACTT AGAT CAGCT GGTGGAGAT GGCCAAT 1082 



Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I II I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1083 TACT AT GCTCTTTCC CAC CAACAGAAGAGCC GT GC CTT CTAC C GT AT C CAAGC C ACT C GT 1142 

Qy 1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1143 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGCCAAGAAGGC C 1202 

Qy 1141 T C C AGC AT GAGC GAGGT GCAC AC C GAT GAGCCT GAGGACT TT AT T T CCAAGGT C TT CT TT 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1203 TCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTCTTT 1262 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I 
Db 1263 GAC C CAT GT T CTT ACCAGT GC CT G GAGAACT GT GGGGCT GTACT C CT GACAGT G GT GAGG 1322 

Qy 12 61 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT GGACT ACAAAAC AG AGGAT GGT T CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1323 AAAGGGGGAGACAT GT CAAAGAC CAT GT AT GT G GACT AC AAAAC AGAGGAT GGTTCTGCC 1382 

Qy 1321 AATGCAGGGGCT GACTAT GAGTTCACAGAGGGCACGGT GGTTCTGAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1383 AAT GCAGGGGCT GACTAT GAGTT CACAGAGGGCACGGT GGTTCTGAAGCCAGGAGAGACC 1442 

Qy 1381 CAGAAGGAGTTCTCCGTGGGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTT C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1443 CAGAAGGAGTTCTCCGTGGGCATAATT GAT GACGACATTTTT GAGGAGGAT GAACACTTC 1502 

Qy 1441 T T T GTAAGGT T GAGCAAT GT C C GCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GCCT C C A 1500 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1503 T T T GTAAGGTT GAGCAAT GT C C GCAT AGAGGAGGAGC AGC CAGAG GAGGGGAT GC CT C C A 1562 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II II I I I I I I I I 
Db 1563 GCAATATTCAACAGT CTT CCCTT GCCT CGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1622 

Qy 1561 GTT ACC AT CT T GGAT GAT GAC CAT GC AGGCAT CTT CACT TTT GAAT GT GAT ACTATT CAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1623 GTTACCAT CTTGGATGATGACCATGCAGGCAT CTT CACTTTTGAAT GT GAT ACTATT CAT 1682 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1683 GT CAGT GAGAGT AT T GGT GTTAT GGAGGT CAAGGTT CT GCGGACAT CAG GTGCCCGGGGT 174 2 

Qy 1681 AC AGT CAT C GT C CCCT T TAG GACAGT AGAAGG GACAGC CAAGGGT GGCGGT GAGGACTTT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1743 AC AGT CAT C GT C CCCT T TAG GACAGT AGAAGG GACAGC CAAGGGT GG CGGT GAGGACT TT 1802 

Qy 1741 GAAGAC ACAT AT GGG GAGTT GGAAT T CAAGAAT GAT GAAACT GT GAAAAC C ATAAGGGT T 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 

Db 1803 GAAGAC ACAT AT GGG GAGTT GGAAT T CAAGAAT GAT GAAACT GT CAAAACAATT C ACAT C 1862 

Qy 1801 AAAAT AGTAGAT GAGGAG GAAT ACGAAAGGCAAGAGAAT T TCT T CAT TGCCCTTGGT GAA 1860 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1863 AAGGTAATT GATGAT GAGGCAT AT GAGAAAAACAAGAATTACTT CATTGAGATGATGGGC 1922 

Qy 1861 C C GAAAT G GAT G GAACGT G GAAT AT C AGAT GT G ACAGAC AGGAAGCT G 1908 

II Mill II III I I I I I I I I I I I I I I 

Db 1923 CC C CGC AT GGT G GAT AT GAGTT TT CAGAAAGC GCT C CT GTT AT CT CCAGAC AGGAAGCT G 1982 



Qy 1909 ACT AT GGAAGAAGAGGAGGCCAAGAGGAT AGC AGAGAT GGGAAAGCCAGT ATT GG GT GAA 1968 

I I I II I I I I I I I I II I 1 I I I I I II I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1983 ACT AT GGAAGAAGAGGAGGC CAAGAGGAT AGC AGAGAT GGGAAAGCCAGT ATT GGGT GAA 2042 



Qy 1969 C AC C C CAAACT AGAAGT CAT CATT GAAGAGT C CT AT GAGTTCAAGACT AC GGT GGACAAA 2028 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2043 CAC C C CAAACT AGAAGT CAT CATT GAAGAGTCCT AT GAGT TCAAGACT AC GGT GGACAAA 2102 

Qy 2029 CTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTC 2088 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2103 CTGATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTC 2162 

Qy 2089 ATGGAGGC CAT CAC C GT CAGT GCAGCAGGGGAT GAGGAT GAGGAT GAAT C C GGGGAGGAG 2148 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2163 ATGGAGGCCATCACCGTCAGT GCAGCAGGGGAT GAGGAT GAGGAT GAAT CCGGGGAGGAG 2222 

Qy 2149 AGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTG 2208 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2223 AGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCTG 2282 

Qy 2209 TTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATC 2268 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2283 TTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATC 2342 

Qy 2269 CTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACC 2328 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2343 CTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACC 2402 

Qy 2329 ATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCA 2388 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2403 ATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCA 2462 

Qy 2389 GATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGC 2448 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2463 GATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGC 2522 

Qy 244 9 AACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTG 2508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2523 AACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTG 2582 

Qy 2509 GCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCC 2568 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2583 GCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCC 2642 

Qy 2569 TTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGA 262 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2643 TTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGA 2702 

Qy 2629 AGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACA 2688 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2703 AGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACA 2762 



Qy 2689 TGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGC 274 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2763 TGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGC 2822 



Qy 

Db 



274 9 TACATCAAGGGGTTCTAA 2766 

I I I I I I I I I I I I I I I I I I 
2823 TACATCAAGGGGTTCTAA 2840 
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Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 9 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 68 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 
Db 69 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 128 

Qy 121 ACAGGGCAGAACAATGAGT CCT GTT C AGGGT C ATC GGACT GCAAGGAGGGT GT C AT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 129 ACAGGGCAGAACAATGAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAGGGT GT CAT CCT G 188 

Qy 181 C CAAT CT GGTAC CCGGAGAACCCTTC CCT TGGGGACAAGATTGCC AGGGT CATTGTCT AT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 189 C CAAT CT GGTAC CC GGAGAACC CT T C CCT T GG GGACAAGAT T GC CAGGGT CATT GT CT AT 248 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 249 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 308 

Qy 301 TCTATTGAAGT CAT CACCT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAATGGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 309 TCTATT GAAGT CAT CAC CT CTCAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 368 

Qy 361 ACCAGC ACAAC CAC TAT T C GGGT CT G GAAT GAAACT GT CT C CAACCT GAC CCTT AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 369 ACCAGC ACAAC CAC TAT T C GGGT CT GGAAT GAAACT GT CT C CAACCT GAC C CTT AT GGC C 428 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 429 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 488 

Qy 481 AT T G CT GGT GAT CTGGGACCTTCTAC CATT GTAGGGAGTGCAGC CTT CAACAT GTT CATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 489 ATTG CT GGT GAT CT GGGAC CT T CT AC CAT T GT AGGGAGT GC AGC CTT CAACAT GTT CAT C 548 



Qy 541 ATCATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I 

Db 549 AT CATT GGCAT CT GTGT CT ACGT GAT CCCAGACGGAGAGACT C GCAAGAT CAAGCAT CT A 608 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 609 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 668 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 669 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 728 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 

Db 729 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 7 88 

Qy 781 AT GCACAAAAAGT ACC GCAC AGACAAACAC C GAGGAAT TAT C AT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 789 AT GCACAAAAAGT ACC GCACAGACAAACAC C GAGGAAT TAT CAT AGAGACAGAGGGT GAC 848 

Qy 841 CACC CTAAGGGCAT TGAGAT GGAT GGGAAAAT GAT GAATT C C CATT TT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 84 9 CACC CT AAGGGCATT GAGAT GGAT GGGAAAAT GAT GAATTC C CATT TT CT AGAT GGGAAC 908 

Qy 901 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CC GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 909 CT GGT GC C CCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CC GGAT T CT C 968 

Qy 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 969 AAGGAT CT GAAGCAAAAAC ACC CAGAGAAGGACTT AGAT CAGCT GGT G GAGAT GGC CAAT 1028 

Qy 1021 TACT AT G CT CTT T C CC AC CAAC AGAAGAGC C GC GC CT T CT AC C GT AT C CAAG C CACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1029 TACT AT GCTCT T T C CC AC CAAC AGAAGAGC C GT GC CT T CT AC C GT AT C CAAGC CACT C GT 1088 

Qy 1081 ATGATGACTGGT GCAGGCAATATCCTGAAGAAACATGCAGCAGAACAAGC CAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1089 AT GAT GACT G GT GC AGGCAAT AT C CT GAAGAAAC AT GC AG C AGAACAAGC CAAGAAGGC C 114 8 

Qy 1141 T CCAGC AT GAGC GAGGT GCACAC C GAT GAG C CT GAGGACTTT AT TT C CAAGGT CT T CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1149 T CCAGC AT GAGCGAGGT G CACAC C GATGAGC CTGAGGACTTT AT TT C CAAGGT CT T CT TT 1208 

Qy 12 01 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1209 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1268 

Qy 1261 AAAGGGGGAGAC AT GT C AAAGAC CAT GT AT GT GGACT ACAAAAC AGAGGATG GT T CTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1269 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACT ACAAAAC AGAGGAT GGTT CTGCC 1328 



Qy 

Db 



1321 AAT GC AGG GGCT GACT AT GAGT T C ACAGAGGGCAC GGT GGT T CT GAAGCC AGGAGAGAC C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1329 AAT GC AGGGGCT GACT AT GAGT T C ACAGAGGGCAC G GT GGT T CT GAAGC C AG GAGAGAC C 



1380 
1388 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



1381 CAGAAGGAGT T CT CCGT GGGCATAATT GAT GAC GACATTT TT GAGGAGGAT GAACACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I 

1389 CAGAAGGAGTT CT CC GT GGGCATAATT GAT GAC GACAT TTTT GAGGAGGAT GAAC ACTT C 1448 

1441 T TT GTAAG GT T GAGCAAT GT C CG CAT AGAGGAG GAG C AGC CAGAGGAGGGGAT GC CT C C A 1500 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I I II I I I I I I I I I I I I I I I I I I 
1449 T TT GTAAGGTT GAGCAAT GT C CG CATAGAGGAGGAG C AGC CAGAGGAGGGGAT GC CT C C A 1508 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1509 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1568 

1561 GT T AC CAT CTT GGAT GAT GAC CAT GCAGG C AT CTT CACTT T T GAAT GT GAT ACTATT CAT 1620 

I I I I I I III II I I I I III I II II I II I II II I I I II II I I I I I I I I I I I I I I I I I I I I I I 

1569 GT T AC CAT CT T GGAT GATGAC CAT GCAGGCAT CTT CACTTT T GAAT GT GAT ACTATT CAT 1628 

1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1629 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1688 

1681 ACAGTCATCGTCCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGTGGCGGTGAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1689 ACAGT CAT C GT C CCCTT T AGGAC AGT AGAAGGGACAGC CAAGGGT GGC G GT GAGGACT T T 1748 

1741 GAAGAC AC ATAT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAAC C ATAAGGGTT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

1749 GAAGACAC AT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAAACT CTT C AGGT G 1808 

1801 AAAATAGTAGAT GAGGAGGAATACGAAAGGCAAGAGAATTT CTT CATT GCCCTT GGTGAA 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1809 AAGAT AGTT GAT GAC GAGGAAT AT GAGAAAAAGGAT AATTT CTT CATT GAGCT GGGCCAG 1868 

1861 CCGAAAT GGAT GGAACGTGGAATAT CAGATGT GACA GACAGG 1902 

II I I I I I I I I I I I I I I I I I I I I I I I I I I 
1869 CCCCAGTGGCTTAAGCGAGGGATTTCAGCTCTGCTACTCAATCAAGGGGATGGGGACAGG 1928 

1903 AAGCT GACT AT GGAAGAAGAGGAG G CCAAGAGGAT AGC AGAGAT GGGAAAGC CAGT ATT G 1962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1929 AAGCTAACAGCCGAGGAGGAGGAGGCTCGGAGGATAGCAGAGAT GGGCAAGCCAGTT CTT 198 8 

1963 G GT GAAC AC C C C AAAC T AGAAGT CAT CAT T GAAG AGT C C TAT G AGT T C AAGACT AC G GT G 2022 

I I I I II I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1989 G GGGAGAACT GC C GGCT GGAGGT C ATCAT CGAGGAGT CAT AT GAT T T T AAGAAC AC G GT G 204 8 

2023 GACAAACT GAT CAAGAAGACAAAC CTGGC CTT GGT T GT GGGGAC C CATT C CT GGAGGGAC 2082 

II I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2049 GATAAACT C AT CAAGAAAACGAACT T GGC CTT GGT AATT GGGAC C CATT CAT GGAG GGAG 2108 

2083 CAGT T CAT GGAGGC C AT CACC GT CAGT GC AGC AGGGGAT GAGGAT GAGGAT GAA TCC 2139 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

2109 CAGT T T T T AGAG GCAAT T AC GGT GAGC GC AGGGGAC GAGGAGGAGGAGGAGGAC GGGT C C 2168 

2140 GGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGG 2199 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

2169 CGGGAGGAGCGGCTGCCGTCGTGCTTTGACTACGTGATGCACTTCCTGACGGTGTTCTGG 2228 

2200 AAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCC 2259 



Db 



I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

2229 AAGGTGCTCTTCGCCTGTGTGCCCCCCACCGAGTACTGCCACGGCTGGGCCTGCTTTGGT 2288 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



22 60 GTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTC 2319 

I I I I I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2289 GTCTCCATCCTGGTCATCGGCCTGCTCACCGCCCTCATTGGGGACCTCGCCTCCCACTTC 2348 

2320 GGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACC 2379 

I I I I I I I I I I II I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

234 9 GGCTGCACCGTTGGCCTCAAGGACTCTGTCAATGCTGTTGTCTTCGTTGCCCTGGGCACC 2408 

2380 TCT GT C CCAGAT ACGT T T GCC AGCAAAGCT GCT GC C CT C C AGGAT GT AT AT GCAGAC G CC 2439 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2409 TCCATCCCTGACACGTTCGCCAGCAAGGTGGCGGCGCTGCAGGACCAGTGCGCCGACGCG 24 68 

2440 TCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCC 24 99 

I I I I I I I I I I I I I I I I III I I I I I I II II II I I I I I III I III I I II 

2469 TCCATCGGCAACGTGACCGGCTCCAACGCGGTGAACGTGTTCCTTGGCCTGGGCGTCGCC 2528 



2500 TGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGC 2559 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2529 TGGTCTGTGGCCGCCGTGTACTGGGCGGTGCAGGGCCGCCCCTTCGAGGTGCGCACTGGC 2588 

2560 ACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTC 2619 

II I I I I .1 I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I II I 

2589 ACGCTGGCCTTCTCCGTCACGCTCTTCACCGTCTTCGCCTTCGTGGGCATTGCCGTGCTG 2648 



2620 



2679 



TTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
264 9 CTGTACCGGCGCCGGCCGCACATCGGCGGCGAGCTGGGCGGCCCGCGCGGACCCAAGCTC 2708 

2680 GCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAG 2739 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I 
2709 GCCACCACCGCGCTCTTCCTGGGCCTCTGGCTCCTGTACATCCTCTTCGCCAGCCTGGAG 2768 

2740 GCCTATTGCTACATCAAGGGGTTCTA 2765 

I I I I I I I I I I I I I I I I I I I I 
2769 GCGTACTGCCACATCCGGGGCTTCTA 2794 
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Query Match 64.6%; Score 1786.4; DB 15; Length 2534; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1787; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

II I II I I I I I I II I I I I III III I I I I I I I I I I I I I I I I I I II I I II II III I I II I II I 

Db 4 03 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 4 62 

Qy 121 AC AGGGC AGAACAAT GAGT C CT GT T C AGGGT CAT C GGACT GCAAGGAGGGT GT C AT CCT G 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 463 AC AGGGC AGAACAAT GAGT CCT GT T C AGGGT CAT C GGACT G C AAGGAGGGT GT CAT CCT G 522 

Qy 181 C CAAT CT G GT AC C C GGAGAACCCTT C CCT T GGGGACAAGAT T GC CAGGGT CATT GT CT AT 240 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 523 C CAAT CT G GT AC C C G GAGAACCCTT C C CT T GGGGACAAGAT T GC CAGGGT CATT GT CT AT 582 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 583 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 

Qy 301 T CTATTGAAGT CATCACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 643 T CTATTGAAGT CATCACCTCTCAAGAGAGGGAGGT GACAATTAAGAAACCCAAT GGAGAA 7 02 

Qy 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 703 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 762 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 763 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 822 

Qy 481 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 823 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 882 

Qy 541 ATCATT GGCAT CTGTGT CTACGT GATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 883 ATCATT GGCAT CTGTGT CTACGT GATCCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 942 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 94 3 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1002 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 ll 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 



781 



1123 



841 



AT GCACAAAAAGTAC C GC AC AGACAAACACCGAGGAAT TAT CAT AGAGAC AGAGGGT GAC 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GCACAAAAAGTAC C GCACAGACAAACAC CGAGGAAT TAT CAT AGAGAC AGAGGGT GAC 



C AC CCTAAGGGCATT GAGAT GGAT GGGAAAAT GATGAATT C C CAT T TT CT AGAT GGGAAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1183 CAC CCTAAGGGC AT T GAGAT GGAT G GGAAAAT GAT GAAT T C CCAT TTT CT AGAT GGGAAC 



901 



1122 



840 



1182 



900 



1242 



960 



CT GGT GC C CCT GGAAGGGAAGGAAGTGGAT GAGT CC CG CAGAGAGAT GAT CC GGATT CT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1243 CT GGT GCC CCT GGAAGGGAAGGAAGTGGAT GAGT CC CGCAGAGAGAT GAT CC GGATT CT C 1302 

961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGATGGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1303 AAGGAT CT GAAGCAAAAAC AC CCAGAGAAGGACTT AGAT CAGCTGGT GGAGATGGCCAAT 1362 

1021 TACT AT GCT CT T T C C CAC C AACAGAAGAGCC G C GCCTT CTAC C GT AT C CAAGCC ACT C GT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1363 T ACTAT GCT CT T TC C CAC CAACAGAAGAGC CGC GC CTT CTAC C GT AT C CAAGCC ACT C GT 1422 

1081 AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAAC AT GCAGCAGAACAAGC CAAGAAG GC C 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GAT GACT GGT GCAGGCAAT AT C CT GAAGAAACAT GCAGCAGAACAAGC CAAGAAGGC C 14 82 



1423 



1141 T C CAGCAT GAGC GAGGT GC AC AC C GAT GAGC CT GAGGACTTT ATT T C CAAGGTCTT CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1483 T C CAGCAT GAGC GAG GT GC ACACC GAT GAGC CT GAGGACTTT ATTT C CAAGGTCT T CT T T 



1542 



1201 GAC CCAT GTT CTT AC C AGT GC CT GGAGAACTGT GGG G CT GT ACT C CT GACAGT GGT GAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1543 GAC CCAT GTT CT T AC CAGT GCCT GGAGAACTGT GGGGCT GTACT C CT GAC AGT GGT GAGG 1602 

1261 AAAGGGGGAGAC AT GT CAAAGAC CAT GT AT GT G GACTACAAAACAGAGGAT GGTT CT GC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1603 AAAGGGGGAGACAT GT CAAAGAC CAT GTAT GT GGACTACAAAACAGAGGAT GGTT CT GC C 



1321 



1663 



1662 



AAT GC AGGGGCT GACT AT GAGTT C AC AGAGGGC ACGGT G GT T CT GAAGC C AGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAT GC AGGGGCT GACT AT GAGTT CAC AGAGGGC ACGGT G GTT CT GAAGC C AGGAGAGAC C 



1722 



1381 CAGAAG GAGT T CTCCGT G GGC ATAAT T GAT GAC GACATT TTT GAGGAGGAT GAAC ACT T C 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1723 CAGAAG GAGT T CT CCGT GGGC AT AATT GAT GAC GACATT TT T GAGGAGGAT GAAC ACT T C 1782 

1441 TTT GT AAG GT T GAGCAAT GT C CGCAT AGAGGAGGAGCAG C CAGAGGAGGGGAT G CCT C C A 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1783 TTT GT AAGGT T GAGCAATGT C CGC AT AGAGGAGGAGCAG CCAGAGGAGGGG AT GCCT C C A 1842 

1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

1561 GTT AC C AT CT T GGAT GAT GAC C AT GC AGGCAT CTT CACT TT T GAAT GT GAT ACT AT T CAT 1620 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1903 GTT ACC AT CT T GGAT GAT GACCAT GCAGGCATCT T C ACTT T T GAAT GT GAT ACT AT T CAT 1962 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1963 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2022 

Qy 1681 ACAGT CAT C GT CC C CTT T AGGACAGT AGAAGGGACAGC CAAGGGT GG CGGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2023 ACAGT CAT C GT C C C CT TTAGGAC AGT AGAAGGGACAGCCAAGGGT GGCG GT GAGGACTT T 2082 

Qy 1741 GAAGACAC ATAT GGGGAGTT GGAATT CAAGAAT GAT GAAACT GT GAAA 1788 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2083 GAAGACAC ATAT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT GTAA 2130 



RESULT 9 
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Query Match 64.6%; Score 1786.4; DB 15; Length 2534; 
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Matches 1787; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 343 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 402 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 403 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 462 

Qy 121 AC AGGGC AGAACAAT GAGT C CT GT T CAGGGT C AT CGGACT GCAAGGAGGGT GTCAT C CTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 463 ACAGG GCAGAAC AAT GAGT CCT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CTG 522 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 523 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 582 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I II I II I I II I 

Db 583 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 642 

Qy 301 T CT ATT GAAGT CAT CAC CT CT CAAGAGAGGGAGGT GACAAT T AAGAAAC C CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 643 T CT ATTGAAGTCAT CACCTCTCAAGAGAGGGAGGTGACAATTAAGAAACCCAATGGAGAA 702 

Qy 361 AC CAGC ACAAC CACT AT T C GGGT CT GGAAT GAAACT GT CT C CAACCT GACCCT T AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 703 AC CAGC ACAAC CAC TAT T C GGGT CT GGAAT GAAACT GT CT C CAACCT GACCCTT AT GGC C 762 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 763 CT GGGT TCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGT CAT GGGTTC 822 

Qy 481 ATTGCT GGT GAT CT GGGAC CTT CT AC CAT T GTAGGGAGTGCAGC CT T CAACAT GTT CAT C 540 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 823 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 882 

Qy 541 AT CATTGGCATCT GTGTCTACGTGAT CCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 600 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 883 ATCATT GGCATCT GTGT CTACGTGAT CCCAGACGGAGAGACTCGCAAGAT CAAGCATCTA 942 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 943 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 1002 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1003 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 1062 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1063 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 1122 

Qy 781 AT GCACAAAAAGT ACC GC ACAGACAAACAC C GAG GAATT AT CAT AGAGACAGAGGGTGAC 840 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1123 ATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTATCATAGAGACAGAGGGTGAC 1182 

Qy 841 C ACC CT AAGGG C AT TGAGAT GGAT GGGAAAAT GAT GAATT C C C ATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1183 CACC CTAAGGGCATTGAGATGGAT GGGAAAAT GATGAATT CC CATTTTCTAGATGGGAAC 1242 

Qy 901 CTGGTGCCCCT GGAAGGGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CC GGAT T CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1243 CTGGTGCCCCTG GAAG GGAAGGAAGT GGAT GAGT CCC GCAGAGAGAT GAT CCGGAT T CT C 1302 

Qy 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGAT GGCCAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1303 AAGG AT CT GAAG CAAAAAC ACCCAGAGAAG GACT T AGAT C AGCT GGT GGAGAT G GC CAAT 1362 . 

Qy 1021 TACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACTCGT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1363 T ACT AT GCT CTT T C CC AC CAAC AGAAGAG CCGCGCCTT CT AC CGT AT C CAAG C C ACT C GT 1422 



Qy 1081 AT GAT GACT GGT GC AGGCAAT AT C CTGAAGAAAC AT GCAGCAGAACAAGC CAAGAAGGCC 114 0 

I II I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1423 AT GAT GACT G GT GCAGGCAAT AT C CTGAAGAAAC AT GCAGCAGAACAAGCCAAGAAGGC C 1482 

Qy 1141 T C CAGCAT GAGC GAGGT GC AC AC C GAT GAGCCTGAGGACT TT ATT T C CAAGGT CTTCT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1483 T C CAGCAT GAGC GAG GT GC ACAC C GAT GAGCCT GAGGACTTT AT T T C CAAGGT CT T CT T T 1542 

Qy 1201 GACC CAT GT T CT T AC CAGT G C CT GGAGAACT GT GGGGCT GT ACT CCT GACAGT GGTGAGG 1260 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I 
Db 1543 GACCCATGTTCTTACCAGTGCCT GGAGAACT GTGGGGCTGTACTCCT GACAGT GGTGAGG 1602 

Qy 1261 AAAGGGGGAGACAT GT CAAAGACCATGTAT GT GGACTACAAAACAGAGGATGGTT CTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1603 AAAG GGGGAGAC AT GT CAAAGAC CAT GT AT GT GGACTACAAAACAGAGGAT GGT T CT GC C 1662 

Qy 1321 AAT GCAGGGG CT GACT AT GAGTT C ACAGAGGGCAC GGT GGTT CT GAAGC CAGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1663 AAT GC AGGGGCT GAC TAT GAGTT C ACAGAGGGCAC G GT GGTT CT GAAGC CAGGAGAGAC C 1722 

Qy 1381 CAGAAGGAGTTCT CCGT GGGCATAATTGATGACGACATTTTTGAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1723 CAGAAGGAGTTCT CCGT GGGCATAATT GATGACGACATTTTT GAGGAGGAT GAACACTT C 1782 

Qy 1441 TT TGTAAGGTT GAGCAAT GT C CGCATAGAGGAGGAGCAGC CAGAGGAGGGGAT GC CT C C A 1500 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1783 TT T GTAAGGTT GAGCAAT GT C CGCATAGAGGAGGAGCAGC CAGAGGAGGGGAT G C CT C CA 1842 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1843 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1902 

Qy 1561 GTTACCAT CTT GGAT GATGACCATGCAGGCAT CTT CACTTTT GAAT GTGATACTATTCAT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1903 GT T AC CAT CT T GGAT GAT GAC CAT GCAGGC AT CTT CACTT TT GAAT GT GAT ACT ATT CAT 1962 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1963 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 2022 

Qy 1681 ACAGT CAT C GT CC C CT TT AGGAC AGT AGAAG GGAC AGC CAAGGGT GGC GGT GAG GACT T T 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2023 ACAGT CAT C GT C C C CT TT AGGACAGTAGAAGGGACAGC CAAGGGT GGC GGT GAG GACT T T 2082 

Qy 1741 GAAGACAC AT AT GGGGAGT T GGAAT TCAAGAATGAT GAAACT GT GAAA 1788 

I I I I II I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 
Db 2083 GAAGACAC AT AT GGGGAGTT GGAAT TCAAGAAT GAT GAAACT GT GTAA 2130 



RESULT 10 
US-09-804-474A-3 

; Sequence 3, Application US/09804474A 

; Patent No. US20020119518A1 

; GENERAL INFORMATION: 

; APPLICANT: KODET, Stefan et al 

; TITLE OF INVENTION: ISOLATED HUMAN TRANSPORTER PROTEINS, 



; TITLE OF INVENTION: NUCLEIC ACID MOLECULES ENCODING HUMAN TRANSPORTER 
PROTEINS, 

; TITLE OF INVENTION: AND USES THEREOF 
; FILE REFERENCE: CL000891 

; CURRENT APPLICATION NUMBER: US/09/804 , 474A 
; CURRENT FILING DATE: 2001-03-13 
; NUMBER OF SEQ ID NOS : 4 

; SOFTWARE: FastSEQ for Windows Version 4.0 

; SEQ ID NO 3 

; LENGTH: 126512 

; TYPE: DNA 

ORGANISM: Human 

FEATURE: 

NAME/KEY: misc_f eature 
LOCATION: ( 1 )...( 126512) 
OTHER INFORMATION: n = A,T,C or G 
US-09-804-474A-3 

Query Match 64.5%; Score 1784.8; DB 9; Length 126512; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1786; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 



Qy 1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I 
Db 2010 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 2069 

Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I 
Db 2070 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 2129 

Qy 121 AC AGGGC AGAACAATGAGT C CT GT T CAGGGT CAT C GGACT GCAAGGAGGGT GT CAT C CT G 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2130 ACAGGGCAGAACAATGAGT C CT GTT CAGGGT C AT CGGACT GCAAGGAGGGT GT C AT CCT G 2189 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2190 C CAAT CT GGT AC C C GGAGAACC CT T C CCT T GGGGACAAGATT GC CAGGGT CAT T GT CTAT 2249 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2250 TTTGTGGCCCT GAT AT ACAT GTTCCTTGGGGTGTC CAT CAT T G CTGAC C GCTT C AT GGC A 2309 

Qy 301 T CTAT T GAAGT CAT CAC CT CT CAAGAGAGG GAGGT GACAAT T AAGAAACCCAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I 
Db 2310 T CT AT T GAAGT CAT CAC CT CTCAAGAGAGG GAGGT GACAAT TAAGAAAC CCAAT G GAGAA 2369 

Qy 361 AC CAG C ACAAC C ACT ATT C GGGT CT GGAAT GAAACT GT CT C CAACCT GACCCT T AT GGC C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2370 AC CAG C ACAACAACT AT T C GGGT CT GGAAT GAAACT GT CT C CAACCT GAC CCTT AT GGC C 2429 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2430 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 2489 

Qy 481 ATT GCT GGT GAT CTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACAT GTT CATC 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I II I I I I I I I I I I I I I I I I I 
Db 2490 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 2549 



Qy 

Db 



541 ATCATTGGCATCTGTGTCTACGTGATCCCAGACGGAGAGACTCGCAAGATCAAGCATCTA 600 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 
2550 AT CATT GGCAT CT GT GT CTAC GT GAT CC CAGACGGAGAGACT C GCAAGAT CAAGC AT CTA 2609 



Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2610 C GAGT CT T CTT CAT CAC CGCTGCTTG GAGT AT CTTT GC CT ACAT CT GGCT CT AT AT GAT T 2669 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I ! I I II I I I I I I I I I I I I 

Db 2670 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 2729 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2730 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 2789 

Qy 781 AT GC ACAAAAAGT ACC GCAC AGACAAAC AC CGAGGAAT TAT CAT AGAGACAGAGGGT GAC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2790 AT GCAC AAAAAGT ACC GCACAGACAAACACCGAGGAAT TAT CAT AGAGACAGAGGGT GAC 2849 

Qy 841 CACCCT AAGGGC AT TGAGAT GGAT GGGAAAAT GAT GAATT C C C ATTTT CT AGAT GGGAAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2850 CACCCTAAGGGCATTGAGAT GGATGGGAAAAT GAT GAATT CCCATTTTCTAGAT GGGAAC 2909 

Qy 901 CTGGT GCCCCT GGAAGGGAAGGAAGT GGATGAGT CCCGCAGAGAGATGATCCGGATTCT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2910 CT GGT GCCCCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC G GAT TCT C 2969 

Qy 961 AAGGAT CT GAAGCAAAAACACCCAGAGAAGGACT T AGAT CAGCT GGT GGAGAT GGC CAAT 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2970 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGTGGAGAT GGC CAAT 3029 

Qy 1021 TACT AT G CT CT T T C CCAC CAACAGAAGAGC C GCGC CT T CTAC C GT AT C CAAGC C ACT C GT 1080 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3030 T ACT AT GCT CTT T C CCAC CAACAGAAGAGC C GCGC CT T CTAC C GT AT C CAAGC C ACT C GT 3089 

Qy 1081 ATGATGACTGGT GCAGGCAATAT CCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I I I I I I I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3090 AT GATGACTGGT GCAGGCAATAT CCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 314 9 

Qy 1141 T C CAGC AT GAGC GAGGT GCACAC C GAT GAGC CTGAGGACT T TAT TT C CAAGGT CT T CTT T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3150 T C CAGC AT GAGC GAGGT GCACAC C GAT GAGC CTGAGGACT T TAT T T C CAAG GT CTT CT T T 3209 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3210 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 3269 

Qy 1261 AAAGGGGGAGACATGT CAAAGACCATGT AT GTGGACTACAAAACAGAGGATGGTTCTGCC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3270 AAAGGGGGAGACAT GTCAAAGACCAT GT AT GTGGACTACAAAACAGAGGATGGTTCTGCC 3329 



Qy 

Db 



1321 AATGCAGGGGCT GACTAT GAGT T CACAGAGG GCAC GGT GGT TCT GAAGCCAGGAGAGACC 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3330 AATG C AGGGGCT GACTAT GAGT T CACAGAGGGCAC GGT GGTT CT GAAGC C AGGAGAGAC C 3389 



Qy 1381 CAGAAGGAGT TCT C C GT GGGC ATAATTGAT GAC GACATTTT T GAGGAGGAT GAAC ACTT C 1440 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3390 CAGAAGGAGT TCT C CGT GGGCATAATT GAT GAC GACATTTT T GAGGAGGAT GAACACT T C 34 4 9 

Qy 1441 TTTGTAAGGTTGAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGATGCCTCCA 1500 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 3450 TTT GTAAGGTTGAGCAAT GTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT CCA 3509 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3510 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 3569 

Qy 1561 GT T AC CAT CTT GGAT GAT GAC CAT GCAGGC ATCTT CACTTT T GAAT GT GAT ACT ATT CAT 1620 

1 1 1 1 1 1 1 1 in i ii ii i ii ii 1 1 1 if 1 1 1 M it in ii ii 1 1 1 1 1 1 1 1 1 1 ii ii ii mi 

Db 3570 GTT ACCAT CTT GGAT GAT GAC CAT GCAGGCATCTTCACTTTTGAATGT GATACTATTCAT 3629 

Qy 1621 GTCAGTGAGAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3630 GT CAGT GAGAGTATT GGT GT TAT GGAGGT C AAGGT T CTGCG GACAT CAGGT GCC C GGGGT 3689 

Qy 1681 AC AGT CAT CGT C C C CTT T AGGAC AGT AGAAGGGAC AGCCAAGGGT GGC GGT GAGGACTTT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 3690 AC AGT CAT CGTC C C CTT T AGGAC AGT AGAAGGGAC AGCCAAGGGT GGCGGT GAGGACTT T 374 9 

Qy 1741 GAAGACACAT AT GGGGAGT T GGAAT T CAAGAAT GAT GAAACT GT GAAA 1788 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II 
Db 3750 GAAGACACAT AT GGGGAGT T GGAATT CAAGAAT GAT GAAACT GT GTAA 3797 



RESULT 11 
US-10-054-680-3 

; Sequence 3, Application US/10054680 
; Publication No. US20020132998A1 
; GENERAL INFORMATION: 
; APPLICANT: Friddle, Carl Johan 
; APPLICANT: Hilbun, Erin 

; TITLE OF INVENTION: No. US20020132998Alel Human Ion Exchanger Proteins and 

Polynucleotides Encoding the 

; TITLE OF INVENTION: Same 

; FILE REFERENCE: LEX-0301-USA 

; CURRENT APPLICATION NUMBER: US/10/054 , 680 

; CURRENT FILING DATE: 2002-01-22 

; PRIOR APPLICATION NUMBER: US 60/263,384 

; PRIOR FILING DATE: 2001-01-23 

; NUMBER OF SEQ ID NOS : 5 

; SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 3 

LENGTH: 1863 

TYPE: DNA 
; ORGANISM: homo sapiens 
US-10-054-680-3 



Query Match 64.5%; Score 1784.6; DB 14; Length 1863; 

Best Local Similarity 98.5%; Pred. No. 0; 

Matches 1813; Conservative 0; Mismatches 24; Indels 4; Gaps 1; 



Qy 



1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Db 



I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1 ATGGCGTGGTTAAGGTTGCAGCCTCTCACCTCTGCCTTCCTCCATTTTGGGCTGGTTACC 60 



Qy 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 61 TTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCAGGGGACGTGCCAAGC 120 

Qy 121 ACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 ACAGGGCAGAACAAT GAGT C CTGT T CAGGGTC AT C GGACT GCAAGGAGGGTGT CAT CCT G 180 

Qy 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTAT 240 

Qy 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCA 300 

Qy 301 T CT AT T GAAGT CAT C ACCT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 T CT AT T GAAGT CAT CACCT CT CAAGAGAGGGAGGT GACAATTAAGAAAC CCAAT GGAGAA 360 

Qy 361 ACC AGC ACAAC CACT ATT CGGGT CT GGAAT GAAACT GT CT CCAAC CT GAC C CT T AT GGCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACCAGCACAACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCC 420 

Qy 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTC 4 80 

Qy 481 ATTGCT GGT GAT CT GGGAC CT TCT AC CAT T GT AGGGAGT GCAGCCTT C AACAT GT T CAT C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 ATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCCTTCAACATGTTCATC 540 

Qy 541 ATCATTGGCAT CTGT GTCTACGT GAT CCCAGACGGAGAGACTCGCAAGATCAAGCAT CTA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 ATCATTGGCAT CTGT GTCTACGT GAT CCCAGACGGAGAGACTCGCAAGATCAAGCAT CTA 600 

Qy 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 601 CGAGTCTTCTTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATT 660 

Qy 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

I I I I I I I I I I.I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTC 720 

Qy 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATAC 780 

Qy 781 AT GC ACAAAAAGT AC C GCACAGACAAACAC C GAGGAATT AT C AT AGAGACAGAGGGT GAC 840 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 781 AT GC AC AAAAAGT AC C GCACAGACAAACAC C GAGGAATT AT CAT AGAGACAGAGGGT GAC 840 

Qy 841 C AC CCT AAGG G CATT GAGAT GGAT GGGAAAAT GAT GAATT CC CAT TTT CT AGAT GGGAAC 900 

I I II I I I II II I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 



Db 841 C AC C CTAAGGG C AT T GAGAT GGAT GG GAAAAT GAT GAATT C C C ATT T T CT AGAT GGGAAC 900 

Qy 901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGATT CT C 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I 

Db 901 CT GGT GCC CCT GGAAGGGAAGGAAGT GGAT GAGT C C C GCAGAGAGAT GAT CC GGATT CT C 960 

Qy 961 AAGGAT CTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCTGGT GGAGATGGCCAAT 1020 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 AAGGATCTGAAGCAAAAACACCCAGAGAAGGACTTAGATCAGCT GGT GGAGATGGCCAAT 1020 

Qy 1021 T ACT AT GCT CT T T C CC ACCAAC AGAAGAGC CGC GC CT T CT AC C GTAT CCAAGC C ACTC GT 1080 

I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 T ACT AT GCTCT TT C CCAC CAACAGAAGAGC CGCGCCTT CT AC C GTAT CCAAGC CACTCGT 1080 

Qy 1081 AT GATGACTGGTGCAGGCAATAT CCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1081 AT GAT GACTGGTGCAGGCAATATCCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCC 1140 

Qy 1141 T C CAGC AT GAGC GAGGT GC ACACC GAT GAGC CT GAGGACT TT AT TT C CAAGGT CTT CT T T 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 T C CAGC AT GAGC GAGGT GC ACACC GAT GAGC CT GAGGACTTT AT TT C CAAGGT CTT CT T T 1200 

Qy 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 GACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTGAGG 1260 

Qy 1261 AAAGGGG GAGAC AT GT CAAAGACCAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CTGC C 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1261 AAAGG GG GAGAC AT GT CAAAGAC CAT GTAT GT GGACT ACAAAACAGAGGAT GGTT CT G C C 1320 

Qy 1321 AAT GC AGGGGCT GACT AT GAGT T CACAGAGGGCAC GGT GGTT CT GAAG C C AGGAGAGAC C 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 AAT GC AGGGGCT GACTATGAGTT CACAGAGGGCAC GGT GGTT CT GAAGCC AGGAGAGAC C 1380 

Qy 1381 CAGAAGGAGTTCT CCGT GGGCATAATTGAT GACGACATTTTT GAGGAGGATGAACACTTC 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGAAGGAGTTCT CCGT GGGCATAATTGAT GACGACATTTTT GAGGAGGATGAACACTTC 1440 

Qy 1441 TT T GT AAGGT T GAGCAAT GT CC GCAT AGAG GAGGAGC AGC CAGAGGAGGGGAT GC CT C CA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II 
Db 1441 TT TGTAAGGT T GAGCAAT GT CC GCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT C CA 1500 

Qy 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 
Db 1501 GCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACA 1560 

Qy 1561 GT T AC CAT CT T GGAT GAT GACCAT GCAGGCAT CT T CACTT T T GAAT GT GAT ACTATT C AT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GTT AC CAT CT T GGAT GAT GACCAT GCAGGCAT CT T CACTT TT GAAT GT GAT ACTATT CAT 1620 

Qy 1621 GT CAGT GAGAGT ATTGGT GT TAT GGAGGT CAAGGTT CT GC G GACAT CAGGT GC C C GGGGT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1621 GT CAGT GAGAGTATT GGT GT TAT GGAGGT CAAGGT TCTGCG GACAT CAGGT GCCC GGGGT 1680 

Qy 1681 AC AGT C AT CGT C C C CTT T AGGACAGTAGAAGGGAC AGC CAAGGGT GGC GGT GAGGACT T T 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ACAGT CAT C GT C C C CTT TAG GACAGT AGAAGGGAC AG C CAAGGGT GG C GGTGAG GACT T T 1740 



Qy 1741 GAAGACACAT AT GGGGAGTT GGAAT T CAAGAAT GAT GAAAC T GT G AAAAC C AT AAG 1796 

I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GAAGACAC AT AT GGGGAGTT GGAAT TCAAGAAT GAT GAAACT GT AT GT GAC AGACAGGAA 1800 

Qy 1797 GGTTAAAAT AGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGA 1837 

III I I I I I I I I I I I I I I I I I I I I 

Db 1801 GCT GACT AT GGAAGAAGAGGAGG C CAAGAGGATAGCAGAGA 1841 
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Qy 130 AACAATGAGTC CT GT T C AGGGT CAT CGGACT GCAAGGAGG GT GT CAT CCT GC CAAT CT GG 189 

I I I II III I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 208 AGCACAGGGGGCTGCCAGGGGTCCTACCGCTGCCAGCCGGGGGTGCTGCTGCCCGTGTGG 267 

Qy 190 TACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCC 249 

I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I 

Db 268 GAGCCCGACGACCCGTCGCTGGGTGACAAGGCGGCACGGGCAGTGGTGTACTTTGTGGCC 327 

Qy 250 CT GATAT AC AT GTTCCTTGGGGT GT CC AT CAT T GCT GAC C GCT T CAT GGCAT CT AT T GAA 309 

II I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I II II 

Db 328 AT GGT CT AC AT GT TT CT GGGAGT GT CC AT CAT C GC C GACC GT T T C AT GGCGGC CAT C GAG 387 

Qy 310 GT CAT CAC CTCT CAAGAGAGGGAG GT GACAAT TAAGAAAC C CAAT GGAGAAAC CAGC AC A 369 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I 
Db 388 GT CAT CAC GTCAAAAGAGAAGGAGAT CAC CAT CAC CAAG GC CAAC GGT GAGAC CAGC GT G 447 

Qy 370 ACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCC 429 

III I I I I I I I I I I I I II II II I I I I I I I I II II I I I I I I I I I I I III 
Db 448 GGCACCGTTCGCATCTGGAATGAGACGGTGTCCAACCTCACGCTCATGGCCCTGGGCTCC 507 

Qy 430 TCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGT 489 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I 



Db 508 TCCGCACCTGAGATCCTGCTGTCAGTCATCGAAGTCTGCGGCCACAACTTCCAGGCGGGT 567 

Qy 490 GAT CT GGGAC CTTCT ACC AT T GT AGGGAGT G C AGCCTT CAAC ATGT T CAT CAT CATTGGC 549 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 568 GAGCTGGGCCCAGGCACCATCGTGGGCAGCGCTGCCTTCAACATGTTTGTGGTCATCGCC 627 

Qy 550 AT CT GT GT CT AC GT GATCC CAGAC GGAGAGACT C GCAAGAT CAAGC AT CT ACGAGT CT T C 609 

I II I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I II I II I I I I I 
Db 628 GT GTGCAT CT ACGT C ATC C CAGC C GGCGAGAGC C GCAAGAT CAAGCACCT GAGAGT CTT C 687 

Qy 610 TTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTC 669 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 688 TTTGTCACTGCCTCTTGGAGCATCTTCGCCTATGTCTGGCTTTATCTCATCCTTGCTGTT 747 

Qy 670 TTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTG 729 

. I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I 
Db 748 TTTTCCCCCGGTGTGGTCCAGGTGTGGGAGGCGCTGCTGACCCTGGTCTTCTTCCCGGTG 807 

Qy 730 TGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATACATGCACAAA 789 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 808 TGCGTGGTATTCGCCTGGATGGCCGACAAGCGGCTGCTCTTCTACAAGTACGTGTACAAG 867 

Qy 790 AAGTAC C GCACAGACAAACAC C GAGGAATT AT CAT AGAGACAGAGGGT GAC CAC C CTAAG 849 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 868 C GCT AC C GCAC C GAC C CAC GC AGC GGCAT CAT CATAGGC GCC GAGGGC GAC C CC C C GAAG 927 

Qy 850 G GC ATT GAGAT GGAT GGGAAAAT GAT GAAT T C C CAT TTT CT AGAT GGGAA 899 

I I I I I I I I I I I I I I I II III I I I I I I 

Db 928 AGCATCGAGCTGGACGGCACGTTCGTGGGCGCCGAGGCCCCAGGTGAGCTGGGCGGCCTG 987 

Qy 900 — C CT GGTGC C C CT GGAAGGGAAGGAAGT GGAT GAGT CC C GCAGAGAGAT GAT C C GGAT T 957 

II I I III I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 988 GGCCCGGGCCCCGCCGAGGCGCGCGAGCTGGACGCCAGCCGCCGCGAGGTCATCCAGATC 1047 

Qy 958 CT CAAGGAT CT GAAGCAAAAACAC C C AGAGAAGGACT T AGAT C AGCT GGT GGAGAT GGC C 1017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1048 CT CAAGGAC CT CAAGC AGAAG CAC C CG GACAAGGAT CT GGAGC AGCT GGT GGGCAT CGC C 1107 

Qy 1018 AATTACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACT 1077 

II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1108 AACTACTACGCGCTGCTGCACCAGCAGAAGAGCCGCGCCTTCTACCGCATCCAGGCCACG 1167 

Qy 1078 CGTATGATGACT GGTGCAGGCAATATCCT GAAGAAACAT GCAGCAGAACAAGCCAAGAAG 1137 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1168 CGGCTGATGACCGGCGCCGGGAACGTGCTGCGCAGACACGCGGCGGACGCCTCGCGCAGG 1227 

Qy 1138 GCCTCCAGCATGAGCGAGGTGCACACCGATGAGCCTGAGGACTTTATTTCCAAGGTCTTC 1197 

III I I I I I I I I I I I I I I I I I I I I I I 

Db 1228 GCGGC GCCGGCCGAGGGCGCGGGCGAGGACGAAGACGACGGCGCCAGCCGCATCTTC 1284 

Qy 1198 TTTGACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTG 1257 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I 

Db 1285 TTCGAGCCTAGCCTCTACCACTGCCTGGAGAACTGCGGCTCCGTGCTGCTGTCCGTCACG 1344 

Qy 1258 AGGAAAGGGGGAGACATGTCAAAGACCATGTATGTGGACTACAAAACAGAGGATGGTTCT 1317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1345 TGCCAGGGCGGCGAGGGCAACAGCACCTTCTACGTGGACTACCGCACTGAGGACGGCTCT 1404 
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Qy 
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Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
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1318 GCCAATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAG 1377 

I 1 I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I 
1405 GCCAAGGCGGGCTCCGACTACGAGTACAGCGAGGGCACGCTGGTGTTCAAACCAGGCGAG 1464 

1378 ACCCAGAAGGAGT T CT CC GT GGGCATAAT T GAT GAC GACATT T T T GAGGAGGAT GAACAC 1437 

II I I I I I I I I I I I ! I I I I I II II I I I I I I I I II I I I I I I I I II II 

14 65 ACGCAGAAGGAGCTGCGCATCGGCAT CAT CGACGACGACATCTTCGAGGAGGACGAGCAT 1524" 

1438 T T CTT T GTAAGGTT GAGC AATGT C C GCAT AGAGGAGGAGC AGC CAGAGGAGGGGAT GC CT 1497 
I I I I I I I I I I I II I I I I I I I I I I I I I I II I 
TTCTTCGTGCGGCTGCTGAACCTGCGCGTGGGCGACGCGCAGGGCATGTTCGAGCCG 1581 



1525 



1557 



1498 CCAGCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAG'CCTCCCCTTGTGTGGCC 

III III II III III I I I I I 

1582 GACGGCGGCGGGCGGCCCAAGGGGCGGCTGGTGGCGCCGCTGCTGGCC 1629 

1558 ACAGTT AC CAT CT T GGAT GAT GAC CAT G CAGGC AT CTT C ACT TT T GAAT GT GAT ACT AT T 1617 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1630 ACCGT C AC CAT C CT GGACGACGACC ACG CAGGCAT CTT CT C CT T CCAGGACC GCCT GCT G 1689 

1618 C ATGT C AGT GAGAGT ATT GGTGTTAT GGAGGT CAAGGTTCT GC GGACAT C AGGT GCC C GG 1677 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

1690 CACGTGAGCGAGTGCATGGGCACCGTGGACGTGCGCGTCGTGCGCAGCTCGGGCGCGCGC 1749 

1678 GGTACAGT CAT CGT CCCCTTTAGGACAGTAGAAGGGACAGCCAAGGGT GGCGGTGAGGAC 1737 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1750 GGCACCGTGCGCCTTCCCTACCGCACGGTGGACGGCACGGCGCGCGGCGGCGGCGTGCAC 1809 

1738 TTTGAAGACACATATGGGGAGTT GGAATT CAAGAAT GATGAAACTGT GAAAACCATAAGG 1797 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

1810 T AC GAG GACGC GT GCGGAGAGCT GGAGTTT GGCGAC GACGAGAC CAT GAAAACT CT T C AG 



1869 



1798 GT TAAAAT AGT AGAT GAGGAGGAAT ACGAAAGGCAAGAGAAT T T CT T C AT TGC C CT T GGT 1857 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1870 GT GAAGATAGTTGATGACGAGGAATATGAGAAAAAGGATAATTT CTTCATTGAGCT GGGC 1929 

1858 GAAC C GAAAT GGAT GGAAC GT GGAAT AT C AGAT GT GACA GAC 1899 

III I I I I I I II II II Mil I II I III 

1930 CAGCCCCAGTGGCTTAAGCGAGGGATTTCAGCTCTGCTACTCAATCAAGGGGATGGGGAC 1989 

1900 AGGAAGCT GACTAT GGAAGAAGAGGAGGCCAAGAGGATAGCAGAGATGGGAAAGCCAGT A 1959 

I I I I I I I I II II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1990 AGGAAG CTAACAGC CGAGGAGGAGGAGGCT C GGAGGAT AGC AGAGAT G GGCAAGC C AGT T 2049 

1960 TT GGGT GAACAC C C C AAACT AGAAGT CAT C ATT GAAGAGT C CT AT GAGT T CAAGACT AC G 2019 

I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I II I I I I III 

2050 CTT G GGGAGAACT G CC GGCT GGAGGT CAT CAT CGAGGAGT CAT AT GAT T TT AAGAACAC G 2109 

2020 GT GGAC AAACT GAT CAAGAAGACAAACCT GGCCT T GGT T GT GGG GAC C C ATT C CT GGAG G 2079 

I I I II I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2110 GT GGAT AAACT CAT CAAGAAAAC GAACTT GGCCT T GGT AAT T GG GAC C C ATT C AT GGAGG 2169 

2080 GACCAGT T CAT GGAGG C CAT CAC C GT CAGT GCAGC AG GG GAT GAG GAT GAGGATGAA 2136 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2170 GAGCAGT T TTT AGAGG CAAT T AC GGT GAG CGCAGG GGAC GAGGAGGAG GAGGAGGACGGG 2229 



Qy 2137 TCCGGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTC 2196 

III I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I II III 
Db 2230 TCCCGGGAGGAGCGGCTGCCGTCGTGCTTTGACTACGTGATGCACTTCCTGACGGTGTTC 2289 

Qy 2197 TGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTC 2256 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I 
Db 2290 TGGAAGGTGCTCTTCGCCTGTGTGCCCCCCACCGAGTACTGCCACGGCTGGGCCTGCTTT 2349 

Qy 2257 GCCGTCTCCATCCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCAC 2316 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I III 
Db 2350 GGTGTCTCCATCCTGGTCATCGGCCTGCTCACCGCCCTCATTGGGGACCTCGCCTCCCAC 2409 

Qy 2317 TTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGC 2376 

I II II I I I I I I I I I I I II I M I I I I III I III I II II 111 II II I III 
Db 2410 TTCGGCTGCACCGTTGGCCTCAAGGACTCTGTCAATGCTGTTGTCTTCGTTGCCCTGGGC 24 69 

Qy 2377 ACCTCTGTCCCAGATACGTTTGCCAGCAAAGCTGCTGCCCTCCAGGATGTATATGCAGAC 2436 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2470 AC CT CCAT C C CT GACAC GT T CGC CAGCAAGGT GGC GGCGCT GCAGGAC C AGT GC GC C GAC 2529 

Qy 2437 GCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTG 2496 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2530 GCGTCCATCGGCAACGTGACCGGCTCCAACGCGGTGAACGTGTTCCTTGGCCTGGGCGTC 2589 

Qy 2497 GCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCC 2556 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 2590 GCCTGGTCTGTGGCCGCCGTGTACTGGGCGGTGCAGGGCCGCCCCTTCGAGGTGCGCACT 264 9 

Qy 2557 GGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTG 2616 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I II 

Db 2650 GGCACGCTGGCCTTCTCCGTCACGCTCTTCACCGTCTTCGCCTTCGTGGGCATTGCCGTG 2709 

Qy 2617 CTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAG 2676 

II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2710 CTGCTGTACCGGCGCCGGCCGCACATCGGCGGCGAGCTGGGCGGCCCGCGCGGACCCAAG 2769 

Qy 2677 CTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTA 2736 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2770 CTCGCCACCACCGCGCTCTTCCTGGGCCTCTGGCTCCTGTACATCCTCTTCGCCAGCCTG 2829 

Qy 2737 GAGGCCTATTGCTACATCAAGGGGTTCTA 2765 

I I I I I I I I I I I I I I I I I I I I I I I 
Db 2830 GAGGCGTACTGCCACATCCGGGGCTTCTA 2858 



RESULT 13 
US-10-281-866-3 

; Sequence 3, Application US/10281866 
; Publication No. US20030091570A1 
; GENERAL INFORMATION: 

; APPLICANT: Silos-Santiago, Inmaculada 

TITLE OF INVENTION: Methods and compositions for the 
; TITLE OF INVENTION: treatment and diagnosis of pain disorders using 46556 
; FILE REFERENCE: MPI01-272P1RM 
; CURRENT APPLICATION NUMBER: US/10/281,866 
; CURRENT FILING DATE: 2002-10-28 
; PRIOR APPLICATION NUMBER: 60/335,078 



PRIOR FILING DATE: 2001-10-31 
NUMBER OF SEQ ID NOS : 3 

SOFTWARE: Fast SEQ for Windows Version 4.0 
SEQ ID NO 3 
LENGTH: 4282 
TYPE: DNA 

ORGANISM: Homo sapien 
FEATURE: 
NAME /KEY : CDS 
LOCATION: (94) . . . (2859) 
US-10-281-866-3 

Query Match 46.2%; Score 1277; DB 15; Length 4282; 

Best Local Similarity 69.1%; Pred. No. 0; 

Matches 1843; Conservative 0; Mismatches 775; Indels 51; Gaps 5; 

Qy 130 AACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGG 189 

III II III Mill I I I I I I I I I I I I I I I I I I I I I I 

Db 208 AGCACAGGGGGCTGCCAGGGGTCCTACCGCTGCCAGCCGGGGGTGCTGCTGCCCGTGTGG 267 

Qy 190 TACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCC 249 

I I I I I I I I I I I I I I I I I I II I II III I I I I I I II I I I I I 1 

Db 268 GAGCCCGACGACCCGTCGCTGGGTGACAAGGCGGCACGGGCAGTGGTGTACTTTGTGGCC 327 

Qy 250 CT GAT AT ACAT GT T C CTT GGGGT GT CCAT CATT GCT GAC CGCTT CAT GGC AT CT ATT GAA 309 

II I I I I I I I I I II II I I I I I I II I I I II I I I I I I I I I I I II I II II 

Db 328 ATGGTCTACATGTTTCTGGGAGTGTCCATCATCGCCGACCGTTTCATGGCGGCCATCGAG 387 

Qy 310 GT CAT C AC CT CT CAAGAGAGGGAGGT GACAATTAAGAAACC CAAT GGAGAAAC CAGCACA 369 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I 
Db 388 GT CAT C ACGT CAAAAGAGAAGGAGAT CAC CAT C AC CAAG GC CAACGGT GAGAC CAGCGT G 447 

Qy 370 ACCACTATTCGGGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCC 429 

III I I I I I I I I I I I I I I II II I I I I I I I I II II I I I I I I I I I I I III 
Db 448 GGCACCGTTCGCATCTGGAATGAGACGGTGTCCAACCTCACGCTCATGGCCCTGGGCTCC 507 

Qy 430 T CT GCT C CT GAGAT ACT C CT CT CT T TAATT GAG GT GTGT GGT CAT GG GT T CAT TGCT GGT 4 89 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II III 

Db 508 T C C GC AC CT GAGAT C CT GCT GT C AGT CAT C GAAGT CT GC GGC CACAACT T CCAGGC GGGT 567 

Qy 490 GAT CT GGGAC CTT CT AC CATT GT AGGGAGT GCAGC CT T CAACAT GTT CAT CAT CATT GGC 549 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 568 GAGCTGGGCCCAGGCACCATCGTGGGCAGCGCTGCCTTCAACATGTTTGTGGTCATCGCC 627 

Qy 550 AT CT GT GT CT ACGT GAT C CC AGAC GGAGAGACT C GC AAGAT CAAGC AT CT AC GAGT CTT C 609 

I II I I I I I I I I I I I I I I III I I.I I I I I I I I I I I I I I II II I I I I I I I I 
Db 628 GT GT GCAT CT ACGT CAT C CC AGCCGGCGAGAGC C GCAAGAT CAAGC ACCT GAGAGT CTT C 687 

Qy 610 TTCATCACCGCTGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTC 669 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 688 TTTGTCACTGCCTCTTGGAGCATCTTCGCCTATGTCTGGCTTTATCTCATCCTTGCTGTT 747 

Qy 670 TTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTG 729 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 748 TTTTCCCCCGGTGTGGTCCAGGTGTGGGAGGCGCTGCTGACCCTGGTCTTCTTCCCGGTG 807 



Qy 



730 



TGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATACATGCACAAA 789 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
TGCGTGGTATTCGCCTGGATGGCCGACAAGCGGCTGCTCTTCTACAAGTACGTGTACAAG 8 67 

AAGT AC C G CACAGACAAAC ACCGAGGAAT TAT CAT AGAGAC AGAGGGT GACCAC CCTAAG 849 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C G CT AC C GC ACCGACC CAC GC AGCGGCAT CAT CAT AGGCGC C GAGG GC GACC C CCC GAAG 927 

GGCAT T GAGAT GGATGGGAAAAT GAT GAATT C CCAT TT T CT AGAT GGGAA 899 

I I I I I I I I I I I I I I I II III I I I I I I 

AGCATCGAGCTGGACGGCACGTTCGTGGGCGCCGAGGCCCCAGGTGAGCTGGGCGGCCTG 987 

- - CCT GGT GC C C CT GGAAGGGAAGGAAGT GGAT GAGT C CC GC AGAGAGAT GAT C C G GAT T 957 

I I I I III I I I I II I I I I I I I I I I I I I I I I I I I I I 

GGCCCGGGCCCCGCCGAGGCGCGCGAGCTGGACGCCAGCCGCCGCGAGGTCATCCAGATC 1047 

CT CAAGGAT CT GAAGCAAAAACACC C AGAGAAGGACTT AGAT C AGCT GGT GGAGAT GGC C 1017 

II I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

CT CAAGGAC CT CAAGC AGAAGC AC CC GGACAAGGAT CT GGAG CAGCT GGT GGGC AT CGC C 1107 



1018 AATTACTATGCTCTTTCCCACCAACAGAAGAGCCGCGCCTTCTACCGTATCCAAGCCACT 1077 

II I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

1108 AACTACTACGCGCTGCTGCACCAGCAGAAGAGCCGCGCCTTCTACCGCATCCAGGCCACG 1167 

1078 CGTAT GATGACT GGTGCAGGCAATAT CCTGAAGAAACATGCAGCAGAACAAGCCAAGAAG 1137 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1168 CGGCTGATGACCGGCGCCGGGAACGTGCTGCGCAGACACGCGGCGGACGCCTCGCGCAGG 1227 

1138 G C CT C CAGCAT GAGCGAGGT GC AC ACCGAT GAGCCT GAGGACTTT AT T T C CAAGGT CT T C 1197 

III I I I I I I I I I I I I I I I I I I I II I 
1228 GCGGC GCCGGCCGAGGGCGCGGGCGAGGACGAAGACGACGGCGCCAGCCGCATCTTC 12 84 

1198 TTTGACCCATGTTCTTACCAGTGCCTGGAGAACTGTGGGGCTGTACTCCTGACAGTGGTG 1257 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I 

1285 TTCGAGCCTAGCCTCTACCACTGCCTGGAGAACTGCGGCTCCGTGCTGCTGTCCGTCACG 1344 

1258 AGGAAAGGGGGAGACATGT CAAAGACCATGTATGT GGACTACAAAACAGAGGATGGTT CT 1317 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

1345 TGCCAGGGCGGCGAGGGCAACAGCACCTTCTACGTGGACTACCGCACTGAGGACGGCTCT 1404 

1318 GCCAATGCAGGGGCTGACTATGAGTTCACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAG 1377 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 05 GCCAAGGCGGGCTCCGACTACGAGTACAGCGAGGGCACGCTGGTGTTCAAACCAGGCGAG 1464 

1378 ACCCAGAAGGAGTT CTCCGT GGGCATAATT GATGACGACATTTTTGAGGAGGATGAACAC 1437 

II I I I I I I I I I I I I I I I I I II II I I I 1 I I 1 I II I I I I I I I I II II 

1465 ACGCAGAAGGAGCT GCGCAT CGGCATCATCGACGACGACATCTT CGAGGAGGACGAGCAT 1524 

1438 T T CTT T GTAAGGT T GAGCAATGT C C GCATAGAGGAGGAGC AGC C AGAG GAGGGGAT GC CT 1497 

I I I I I I I I I I I II I I I I I I I I I I I I I I II I 
1525 TTCTTCGTGCGGCTGCTGAACCTGCGCGTGGGCGACGCGCAGGGCATGTTCGAGCCG 1581 

1498 CCAGCAATATTCAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCC 1557 

III III II II I III I I I I I 

1582 GACGGCGGCGGGCGGCCCAAGGGGCGGCTGGTGGCGCCGCTGCTGGCC 1629 

1558 ACAGTTACCAT CTTGGAT GATGACCATGCAGGCATCTTCACTTTTGAAT GTGAT ACTATT 1617 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I 



Db 1630 ACCGTCACCATCCTGGACGACGACCACGCAGGCATCTTCTCCTTCCAGGACCGCCTGCTG 1689 

Qy 1618 CAT GT CAGT GAGAGT ATT GGT GT T ATGGAGGT CAAGGTT CT G C GGACAT C AG GT GCCC GG 1677 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1690 CACGTGAGCGAGTGCATGGGCACCGTGGACGTGCGCGTCGTGCGCAGCTCGGGCGCGCGC 1749 

Qy 1678 GGT AC AGT C AT C GT C CCCT TTAGGAC AGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGAC 1737 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1750 GGCACCGTGCGCCTTCCCTACCGCACGGTGGACGGCACGGCGCGCGGCGGCGGCGTGCAC 1809 

Qy 1738 TTTGAAGAC ACATATGGGGAGTTGGAATTCAAGAATGAT GAAACT GT GAAAACCATAAGG 1797 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1810 T AC GAGGAC GCGTGC GGAGAGCT GGAGT T T GGC GAC GAC GAGACCAT GAAAACT CTT C AG 1869 

Qy 1798 GT TAAAAT AGTAGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT T TCT T C ATT GCCCTT GGT 1857 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1870 GTGAAGATAGTTGATGACGAGGAATAT GAGAAAAAGGATAATTTCTTCATT GAGCTGGGC 1929 

Qy 1858 GAACCGAAATGGAT GGAACGT GGAATAT CAGATGTGACA GAC 1899 

III I I II I I I I II I I I I I I I I I I III 

Db 1930 CAGCCCCAGTGGCTTAAGCGAGGGATTTCAGCTCTGCTACTCAATCAAGGGGATGGGGAC 1989 

Qy 1900 AGGAAGCT GAC TAT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGC C AGT A 1959 

I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1990 AGGAAGCTAACAGC C GAGGAGGAGGAGGCT C GGAGGAT AGCAGAGAT GGGCAAGC CAGT T 2049 

Qy 1960 T T GGGT GAAC ACCC CAAACT AGAAGTC AT CAT T GAAGAGT C CT AT GAGTT CAAGAC TAC G 2019 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 2050 CTT GGG GAGAACT GC C GGCT GGAGGTC AT CAT C GAGGAGT CAT AT GATTT TAAGAACAC G 2109 

Qy 2020 GT GGACAAACT GAT CAAGAAGACAAAC CT G GCCTTGGTT GT GG GGACC CAT T CCT GGAGG 2079 

I I I I I I II I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2110 GT GGATAAACT CAT CAAGAAAAC GAACT T G G CCTT GGTAAT T GGGAC C CAT T CAT GGAGG 2169 

Qy 2080 GAC CAGT T CAT GGAGGCC AT CAC CGT CAGT G CAGC AGGGGAT GAGGAT GAGGAT GAA 2136 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2170 GAGCAGT TTTTAGAGG CAAT TAC GGT GAGCG CAGGGGAC GAGGAGGAGGAGGAGGACGGG 2229 

Qy 2137 TCCGGGGAGGAGAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTC 2196 

III I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 2230 TCCCGGGAGGAGCGGCTGCCGTCGTGCTTTGACTACGTGATGCACTTCCTGACGGTGTTC 2289 

Qy 2197 TGGAAGGTGCTGTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTC 2256 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2290 TGGAAGGTGCTCTTCGCCTGTGTGCCCCCCACCGAGTACTGCCACGGCTGGGCCTGCTTT 234 9 

Qy 2257 GC C GT CT C CAT C CT CAT CAT T GGCAT GCT CAC C G CCAT CAT T GGGGAC CT GGCCT C GCAC 2316 

I I I I I I I I I I I I II I I III I I I I I I I I I I I I I I I I I I I I I I I I I II I I III 
Db 2350 GGTGTCTCCATCCTGGTCATCGGCCTGCTCACCGCCCTCATTGGGGACCTCGCCTCCCAC 2409 

Qy 2317 TTCGGCTGCACCATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGC 2376 

I II I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I II I III 
Db 2410 TTCGGCTGCACCGTTGGCCTCAAGGACTCTGTCAATGCTGTTGTCTTCGTTGCCCTGGGC 2469 

Qy 2377 ACCTCT GT CC CAGAT ACGT TT GC CAGCAAAGCT GCT GC C CT C CAGGAT GT AT AT GC AGAC 2436 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2470 ACCTCCATCCCTGACACGTTCGCCAGCAAGGTGGCGGCGCTGCAGGACCAGTGCGCCGAC 2529 



Qy 2437 GCCTCCATTGGCAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTG 2496 

II I I I I I I I I I I I I I I I I III I I I I I I II II II I I I I I III I III I 
Db 2530 GCGTCCATCGGCAACGTGACCGGCTCCAACGCGGTGAACGTGTTCCTTGGCCTGGGCGTC 2589 

Qy 2497 GCCTGGTCCGTGGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCC 2556 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2590 GCCTGGTCTGTGGCCGCCGTGTACTGGGCGGTGCAGGGCCGCCCCTTCGAGGTGCGCACT 264 9 

Qy 2557 GGCACACTGGCCTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTG 2616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I 

Db 2650 GGCACGCTGGCCTTCTCCGTCACGCTCTTCACCGTCTTCGCCTTCGTGGGCATTGCCGTG 2709 

Qy 2617 CTCTTGTACCGAAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAG 2676 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2710 CTGCTGTACCGGCGCCGGCCGCACATCGGCGGCGAGCTGGGCGGCCCGCGCGGACCCAAG 2769 

Qy 2677 CTCGCCACAACATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTA 2736 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 277 0 CTCGCCACCACCGCGCTCTTCCTGGGCCTCTGGCTCCTGTACATCCTCTTCGCCAGCCTG 2829 

Qy 2737 GAGGCC T ATT GCTACAT CAAGGGGT T CT A 2765 

I I I I I I I I I I I I I I I II I I I I I I 
Db 2830 GAGGCGTACTGCCACATCCGGGGCTTCTA 2858 



RESULT 14 
US-10-388-934-506 

; Sequence 506, Application US/10388934 

; Publication No. US20040005547A1 

; GENERAL INFORMATION: 

; APPLICANT: Boess, Franziska 

; APPLICANT: Suter-Dick, Laura 

; APPLICANT: Wolf, Detlef 

; TITLE OF INVENTION: BIOMARKERS AND EXPRESSION PROFILES FOR TOXICOLOGY 
; FILE REFERENCE: 21199 

; CURRENT APPLICATION NUMBER: US/10/388,934 

; CURRENT FILING DATE: 2003-03-14 

; PRIOR APPLICATION NUMBER: 02005336.9 

; PRIOR FILING DATE: 2002-03-14 

; PRIOR APPLICATION NUMBER: 02015657.6 

PRIOR FILING DATE: 2002-07-17 
; NUMBER OF SEQ ID NOS: 862 
; SOFTWARE: Patentln version 3.1 
; SEQ ID NO 506 

LENGTH: 3004 
; TYPE: DNA 

ORGANISM: Rattus norvegicus (No. US20040005547Alway rat) 
US-10-388-934-506 

Query Match 45.9%; Score 1270.8; DB 16; Length 3004; 

Best Local Similarity 69.0%; Pred. No. 0; 

Matches 1835; Conservative 0; Mismatches 772; Indels 51; Gaps 5; 

Qy 141 CTGTTCAGGGTCATCGGACTGCAAGGAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAA 200 

III I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 126 CTGCCAAGGTTCCTACCGCTGCCAACCAGGGGTGCTGCTGCCTGTGTGGGAACCCGACGA 185 



201 CCCTTCCCTTGGGGACAAGATTGCCAGGGTCATTGTCTATTTTGTGGCCCTGATATACAT 260 

I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I 
186 CCCATCACTGGGGGACAAGGCTGCACGGGCCGTGGTGTACTTTGTGGCCATGGTCTACAT 245 

261 GTTCCTTGGGGTGTCCATCATTGCTGACCGCTTCATGGCATCTATTGAAGTCATCACCTC 320 

I I I I I II MM I I II I II II I I II II II II II I I II II I II II II I I II 
246 GTTCTTGGGTCTGTCTATCATTGCTGATCGTTTTATGGCATCCATTGAGGTCATCACATC 305 

321 T CAAGAGAGGGAGGT GACAATT AAGAAACC CAAT GGAGAAAC C AGC ACAACCACTAT T C G 380 

I I I I I I I I I II I I I II I II I II II I II I I I I I I I I II 

306 CAAGGAGAAAGAGAT C AC C ATC ACCAAGGCAAAT GGGGAGAC C AGC GTGGGC ACTGT AC G 365 

381 GGTCTGGAATGAAACTGTCTCCAACCTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGA 440 

I I II II I I I II I I II I I I I I I I I II II I I II II I II I I I I II I II I II I I 
366 CATCTGGAATGAAACGGTGTCCAACCTTACACTCATGGCCCTGGGCTCCTCAGCACCTGA 425 

441 GATACTCCTCTCTTTAATTGAGGTGTGTGGTCATGGGTTCATTGCTGGTGATCTGGGACC 500 

III II II III I II I I I I I I I I I I M III II I I I I I II II II 
426 GATTCTGCTGTCTGTCATCGAGGTCTGTGGCCACAACTTCCAGGCGGGTGAGCTAGGCCC 485 

501 TT CT ACCATT GT AGGGAGT GCAGCCTT CAAC AT GTT CAT CAT C ATT GGCAT CT GT GT CT A 560 

I I I I I I I I I II I I I I I II I I I II I I I I I I hi I I I I I I I I I I I I 
486 AGGCACCATCGTGGGCAGTGCCGCCTTCAACATGTTTGTGGTCATTGCTGTGTGTGTGTA 545 

561 CGTGAT CCCAGACGGAGAGACTCGCAAGAT CAAGCATCTACGAGTCTTCTT CATCACCGC 620 

I I II II I I I I I I I I I I I I I I II II I II I I I I I I I I I I II II I I I I 

546 TGT CAT C CCGG CT GGT GAGAGC C GTAAGAT CAAGC ACT TAAGGGT CT T CT T CGT CAC AGC 605 

621 TGCTTGGAGTATCTTTGCCTACATCTGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGG 680 

I I I I I I I II II I I I I I I I I II I I I I Ml I I I I I I I II I I I I I I I II II 
606 CTCTTGGAGCATCTTTGCCTATGTCTGGCTTTATCTCATTCTAGCAGTTTTCTCTCCAGG 665 

681 TGTGGTCCAGGTTTGGGAAGGCCTCCTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCT 740 

II I II I I II I I I I II I I I I I II I I I I I I II II I I I I I I I I I I I I I 

666 CGTGGTCCAGGTGTGGGAGGCACTGCTCACGCTGGTCTTCTTCCCGGTGTGTGTGGTGTT 725 

741 GGCCTGGGTGGCAGATAAACGACTGCTCTTCTACAAATACATGCACAAAAAGTACCGCAC 800 

I I I I I I I I I I II II II I I I I I I I I I I I I I II III II II I I II I I II I 

726 CGCCTGGATGGCGGACAAGCGACTGCTCTTCTACAAGTACGTGTACAAGCGCTATCGCAC 785 

801 AGACAAAC AC C GAGGAAT TAT C ATAGAGAC AGAGGGT GACCAC CCTAAGG GC ATT GAGAT 860 

III I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

786 CGAC C CT C GC AGC GGAAT CAT CAT C GGGGC AGAGGGAGAC C C GCC CAAGAGC AT C GAGCT 845 

861 GGAT GGGAAAAT GAT GAATT CC CAT T T T CT AGAT GGGAA CCTGGTGCC 908 

I I I I I I I I I II I I I I I I I I I III 

846 GGATGGCACATTCGTGGGCACTGAGGTCCCAGGCGAGCTGGGTGCATTGGGCACAGGTCC 905 

909 CCTGGAAGGGAAGGAAGT GGAT GAGT CCCGCAGAGAGATGATCCGGATT CT CAAGGATCT 968 

I I I I I II I I I I I III I II I I I I I I I I II M II II I I 

906 CGCTGAGGCGCGT GAGCT GGACGCCAGCCGGCGCGAGGTCATCCAGATTCTTAAGGACTT 965 

969 GAAGCAAAAACACCCAGAGAAGGACTTAGAT CAGCTGGTG GAGAT GGCCAATTACTATGC 1028 

II I I I II I I II I II MIMI I II I II II I M I I II I I I II I I I I I I I I 

966 AAAGC AGAAGC AC CC GGATAAGGAC CT GGAGC AGCT GGT G GG CAT C GCCAAGT ACT AT GC 1025 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1029 T CT TT C CC AC CAAC AGAAGAGC C GC GCCT T CT AC C GTAT C CAAGC CACT C GT AT GAT GAC 1088 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I 

1026 ACT GCTGCACCAGCAGAAGAGCCGT GCCT TCTACCGCATCCAGGCCACGCGGCT GAT GAC 1085 

1089 TGGT GCAGGCAATAT CCTGAAGAAACAT GCAGCAGAACAAGCCAAGAAGGCCT CCAGCAT 114 8 

II I I I I I I I I I I I I III II II II III II I I 

108 6 AGGTGCGGGCAACGTGCTGCGCCGACACGCTGCGGATGCTGCCCGCAGG CCTGGGGC 1142 

1149 GAGCGAGGT GC AC AC C GAT GAGC CT GAGGACTTTATT T C CAAGGT CT T CTTT GACC CAT G 1208 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I 

1143 CAAC GATGGT GCC C C C GAT GAT GAGGAC GAT GGT GCCAGC C GC AT CT T CTTT GAGC C C AG 1202 

1209 T T CTT ACCAGT GCCT GGAGAACT GTGGGGCTGTACTCCT GACAGT GGT GAGGAAAGGGGG 1268 

I I I I I I I I I I I I I I I I I I I III I II II I I I I Ml I I I I I I I 
CCTCTACCACTGCCTGGAGAACTGCGGGTCAGTGCTGCTGTCGGTGGCTTGCCAGGGTGG 



1203 



1269 



AGACATGT CAAAGACCAT GTATGTGGACTACAAAACAGAGGATGGTTCT GCCAATGCAGG 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1263 TGAGGGCAACAGCACCTTCTACGTGGATTACCGCACGGAGGATGGCTCTGCAAAGGCAGG 



1262 



1328 



1322 



132 9 GGCT GACTATGAGTT CACAGAGGGCACGGTGGTTCTGAAGCCAGGAGAGACCCAGAAGGA 1388 

I II I I II I I I II I I I I I I I I I I I I I I I I I I I II I I.I I I II I I I I I I 

1323 CT C C GATT AT GAGT ACAGC GAGGGCACG CT GGT GTTCAAGC C C GGGGAGAC GC AGAAGGA 1382 

138 9 GTT CT C CGT GGGCAT AATT GAT GAC GAC ATTT TT GAGGAGGAT GAACACT T CT T T GT AAG 1448 

I I I I I I I I I II II I I I I 1 I I I II I I I I I I I I II I I I I I I I I II II 

1383 GCT GCGCAT CGGCAT CAT C GAC GAC GAC AT CT T CGAGGAG GAC GAGC ACT TCTT C GT GAG 1442 

144 9 GTT GAGCAATGTCCGCATAGAGGAGGAGCAGCCAGAGGAGGGGAT GCCT CCAGCAAT ATT 1508 

III I I I I I I I I I I I I I I II 

1443 GCTGCTGAACCTGCGTGTGGGCGATGCTCAGGGCATGTTCGAG CC 1487 

1509 CAACAGTCTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCAT 1568 

I I I I I I I I II III III I I I I I I I I I I I I I I 

1488 CGACGGCGGTGGGCGGCCCAAGGGGCGGCTGGTGGCGCCACTGCTGGCCACCGTCACCAT 1547 



1569 CTT GGAT GAT GAC CAT GC AGGCAT CT T CACTT TT GAAT GT GAT ACTAT T CAT GT CAGT GA 1628 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1548 TCTGGACGACGACCACGCGGGCATCTTCTCCTTCCAGGACCGCCTGCTGCATGTGAGCGA 1607 

1 62 9 GAGTATTGGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCAT 168 8 

I I I I II I I I I I I II I II I I I I I I I I I I I I I I I I 

1608 GTGCATGGGCACCGTGGATGTGCGTGTGGTGCGCAGCTCTGGCGCACGTGGCACCGTACG 1667 

1689 C GT C C C CTT T AGGAC AGT AGAAGGGAC AGC CAAGGGT GGC GGT GAGGACT TT GAAGAC AC 1748 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

1668 CCTTCCCTACCGCACAGTGGACGGCACGGCTCGTGGTGGTGGTGTGCACTACGAGGATGC 1727 

174 9 AT AT GGGGAGT T G GAATT CAAGAAT GAT GAAACT GT GAAAAC CAT AAG G GTTAAAAT AGT 1808 

I II I I I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I 
1728 T T GT GGAGAGCT GGAGTT C GGCGAT GAC GAGAC CAT GAAGACT CTT CAG GT CAAGAT AGT 1787 

1809 AGAT GAGGAGGAAT AC GAAAGGCAAGAGAAT TT CTT CAT T GCC CT T GGT GAAC C GAAAT G 1868 

II II II II II II I I III II I I I I I I I I I I I I I III III 
1788 G GAC GAC G AAG AGT AT GAGAAGAAGGACAACTT CTTCAT CGAGCT GGGCCAGCC CCAGT G 1847 



1869 GAT GGAACGT GGAAT AT C AGAT GT GAC - 



- AGACAGGAAGCT GAC 1910 
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II I I I I I I I 1 1 1 I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1848 GCTTAAGCGGGGCATCTCAGCTCTGCTACTCAACCAAGGGGATGGAGACAGGAAGCTGAC 1907 

1911 T AT GGAAGAAGAGGAGGCCAAGAGGAT AGCAGAGAT GGGAAAGC CAGT ATT GGGT GAAC A 1970 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1908 T GCAGAGGAGGAGGAGGCCCAGAGGATAGCAGAGATGGGCAAGCCAGTTCTT GGGGAGAA 1967 

1971 C C CCAAACT AGAAGT CAT CAT T GAAGAGT CCT AT GAGTT CAAGACT ACGGT GGACAAACT 2 030 

I II II I I I I I I I I II I II I I I I I I I II I I I I I I I I I I I I I I I I I I 

1968 CT GT CGCCTCGAGGTCATCATCGAGGAGT CTTAT GACTTTAAGAAT ACGGT GGATAAACT 2 027 

2031 GATCAAGAAGACAAACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCAT 2090 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
2028 C ATAAAGAAAACAAAC CTGGC CTT GGT GATT GGGAC CC ACT CAT GGAGGGAGCAGT TTT T 2087 

2091 GGAGGCCAT CAC CGT CAGT GC AGCA GGGGATGAGGATGAGGATGAATCCGGGGAGGA 2147 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I 

2088 AGAGGC AGTT ACAGT GAGC GCAGGGGAC GAGGAGGAGGAT GAGGAT GGGT CT C GT GAGGA 2147 

2148 GAGGCTGCCCTCCTGCTTTGACTACGTCATGCACTTCCTGACTGTCTTCTGGAAGGTGCT 2207 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II II 
2148 GCGGCTGCCATCCTGCTTTGACTACGTGATGCACTTCCTGACGGTGTTCTGGAAAGTTCT 2207 

2208 GTTTGCCTGTGTGCCCCCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCAT 2267 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I III 
2208 GTTCGCCTGCCTTCCACCCACGGAGTACTGCCATGGCTGGGCCTGCTTTGGTGTCTGCAT 2267 



2268 



2327 



CCTCATCATTGGCATGCTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCAC 

III I I I I I I I I II I I I I III I I I I II I I I I I I I I I I I I I I I I II I I I I I 
2268 CCTGGTCATTGGTCTGCTCACTGCCCTCATCGGAGACCTGGCCTCACACTTTGGGTGCAC 2327 

2328 CATTGGTCTCAAAGATTCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCC 2387 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I 
2328 CGTGGGCCTCAAGGACTCAGTCAACGCCGTGGTCTTCGTGGCTCTGGGCACCTCCATCCC 2387 

2388 AGAT ACGTT TGC C AGCAAAGCT GCT GC C CT C C AGGAT GT AT ATGC AGAC GCCT C CATT GG 2447 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2388 TGACACGTTTGCCAGCAAGGTGGCCGCGCTGCAGGACCAGTGCGCCGACGCGTCCATCGG 2447 

2448 CAACGTGACGGGCAGCAACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGT 2507 

I I I I I I I I III III II II II II II I I I I I I I I II I I I I I I I I I I II 
24 48 TAACGTGACCGGCTCCAATGCGGTGAACGTGTTCCTGGGCCTGGGTGTGGCCTGGTCGGT 2507 

2508 GGCCGCCATCTACTGGGCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGC 2567 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGCCGCAGTGTACTGGGCGGTGCAGGGTCGCCCCTTCGAGGTGCGTACAGGCACGCTGGC 2567 



2508 



2568 CTTCTCCGTCACCCTCTTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCG 2627 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I 
2568 CTTCTCGGTCACACTGTTCACCGTCTTCGCCTTCGTGGGCATCGCAGTGCTCTTGTACCG 2627 

2628 AAGGCGGCCGCACCTGGGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAAC 2687 

I I I I I I III I II II I I I I I II I I I I I II II I I I I I I I I I I I II 
2628 GCGCCGGCCACACATCGGCGGCGAGCTGGGCGGCCCGCGGGGACCCAAGCTAGCCACCAC 2687 

2688 ATGGCTCTTTGTGAGCCTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTG 2747 
I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 



Db 2688 CGCTCTCTTCCTGGGCCTCTGGTTCCTCTACATTCTCTTCGCCAGCCTGGAGGCTTATTG 2747 



Qy 2748 CTACATCAAGGGGTTCTA 2765 

I I I II I I I I I I I I 
Db 274 8 CCACATTCGGGGCTTCTA 2765 



RESULT 15 
US-09-901-419-1 

Sequence 1, Application US/09901419 
Patent No. US20020069421A1 
GENERAL INFORMATION: 
APPLICANT: The Curators of the University of Missouri 

TITLE OF INVENTION: LARGE SCALE EXPRESSION AND PURIFICATION OF RECOMBINANT 
TITLE OF INVENTION: PROTEINS 
FILE REFERENCE: UM01531.1 

CURRENT APPLICATION NUMBER: US/09/901,419 
CURRENT FILING DATE: 2001-07-09 
PRIOR APPLICATION NUMBER: 60/218,125 
PRIOR FILING DATE: 2000-01-13 
NUMBER OF SEQ ID NOS : 2 
SOFTWARE: Pa tent In Ver. 2.1 
SEQ ID NO 1 
LENGTH: 4087 
TYPE: DNA 

ORGANISM: Bos taurus 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (268) . . (3180) 
NAME/ KEY: sig_peptide 
LOCATION: (268) . . (363) 
NAME/KEY: misc_f eature 
LOCATION: (3178) 

OTHER INFORMATION: A Poly (H) affinity tag comprising 6 His residues 
OTHER INFORMATION: have been inserted at the C-Terminus end of the 
OTHER INFORMATION: coding region of the protein 
US-09-901-419-1 

Query Match 44.4%; Score 1227.8; DB 9; Length 4087; 

Best Local Similarity 67.1%; Pred. No. 0; 

Matches 1935; Conservative 0; Mismatches 777; Indels 171; Gaps 7; 

Qy 46 TTTGGGCTGGTTACCTTTGTGCTCTTCCTGAATGGTCTTCGAGCAGAGGCTGGTGGCTCA 105 

III I I I I I I I I I I I I I I II I I III 

Db 307 T T T CAC GT GAT AGC CAT GGTGGCTCTCTTGTTTTCC CAT GT GGAC CAT ATAAGT GCT GAG 366 

Qy 106 GGGGACGTGCCAAGCACAGGGCAGAACAATGAGTCCTGTTCAGGGTCATCGGACTGCAAG 165 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 367 ACAGAAAT GGAAGGAGAAGGCAAC GAGACT GGC GAGT GT ACT GGCT C CT AT TACT GTAAG 426 

Qy 166 GAGGGTGTCATCCTGCCAATCTGGTACCCGGAGAACCCTTCCCTTGGGGACAAGATTGCC 225 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 427 AAGGGGGTGATTTTACCCATTTGGGAGCCCCAGGACCCTTCCTTTGGAGACAAAATTGCT 486 

Qy 226 AGGGTCATTGTCTATTTTGTGGCCCTGATATACATGTTCCTTGGGGTGTCCATCATTGCT 285 

II I I III I I I I II I I I I II II I II I I I I I I I I II I II II I II II I I I I 
Db 4 87 AGAGCGACTGTGTATTTTGTGGCCATGGTCTACATGTTTCTTGGAGTCTCAATCATTGCT 546 
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286 GAC C GCTT C AT GGCAT CTATT GAAGTC AT C AC CTCT CAAGAGAGGGAGGT GACAAT T AAG 
I I I I I I I I I I 1 I I I II I I 1 I II I I I I I I I I I I I I I I I I II I II II ill 
547 GACCGGT T CAT GT CCT CT AT AGAAGTC AT CACGTCT CAAGAGAAAGAAAT CAC CATAAAG 

346 AAACC CAAT GGAGAAAC C AGC ACAACCACT AT T CGGGT CT GGAAT GAAACT GT CT C CAAC 

I I I I I I I I I I I I I I I I II II II III I II I I I I I I I I I I II II I I I I I I 
AAAC CCAAT GGAGAGAC CAC CAAGACAACT GT GAG GAT CT GGAAT GAGAC AGT GT C CAAC 



607 



406 



667 



CTGACCCTTATGGCCCTGGGTTCCTCTGCTCCTGAGATACTCCTCTCTTTAATTGAGGTG 
I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II I I I I I I I I I I 
CTGACCTTGATGGCCCTGGGGTCTTCAGCTCCAGAGATTCTCCTTTCAGTAATCGAGGTG 



345 



606 



405 



666 



465 



726 



525 



4 66 TGTGGTCATGGGTTCATTGCTGGTGATCTGGGACCTTCTACCATTGTAGGGAGTGCAGCC 
I I I I I III I I I I III II II II II III I I I I I II I I I I I I I I II 
TGTGGCCATAACTTCACTGCAGGAGACCTTGGCCCTAGCACCATCGTGGGGAGTGCTGCA 786 



727 



526 



787 



586 



847 



646 



907 



706 



967 



766 



TTCAACAT GTTCATCAT CATTGGCATCT GTGT CTACGTGAT CCCAGACGGAGAGACT CGC 585 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I II II I I I I I I 

T T CAACAT GTT C AT CAT CATT GC CCTT T GT GT GT AT GTCGT C C CGGAT GGGGAGACAAGG 84 6 

AAGAT CAAGCAT CTACGAGT CTT CT TCAT CAC CGCT GCTT GGAGT AT CTTT G C CT ACAT C 645 

I I I I I I I I I I I I I I 11,11 Mill I II II II I I I I I I I I I I I I I I I I I I 

AAGAT CAAGCAT CTG C GT GT GTT CT TT GT GAC AGC AGCAT G GAGCAT CTT T GC CT AT AC C 906 

TGGCTCTATATGATTCTGGCAGTCTTCTCCCCTGGTGTGGTCCAGGTTTGGGAAGGCCTC 705 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGCTTTACATCATTTTGTCTGTCAGCTCCCCTGGGGTCGTGGAGGTCTGGGAAGGTTTG 966 

CTCACTCTCTTCTTCTTTCCAGTGTGTGTCCTTCTGGCCTGGGTGGCAGATAAACGACTG 765 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

CTTACTTTCTTCTTCTTCCCCATCTGCGTTGTGTTTGCTTGGGTGGCAGACAGGAGGCTT 1026 



825 



CT CTT CT ACAAAT ACATGCACAAAAAGTACCGCACAGACAAACACCGAGGAATTAT CATA 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1027 CT GTT T T ACAAGT AT GT CT ACAAGAGGT AT C GGGCT GGCAAGCAGAGGGGAAT GAT TAT T 1086 



826 



876 



GAG AC AG AG G GT GAC CAC C C T AAGGGCATT GAGAT GGAT GGGAAAAT GAT G 

II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1087 GAACAC GAAGGAGAC AGGC CAT CT T CCAAGAC AGAAAT T GAAAT GGAT GGGAAAGT GGT C 1146 

877 AATTCCCATTTTC TAGATGGGAACCTGGTGCCCCTGGAAGGGAAG 921 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II 

1147 AATT C C CAT GT T GAC AGTT T CTT AGAT GGAGC C CT GGTT CT GGAGGT T GAT GAGAGGGAC 1206 



922 



978 



GAAGT GGAT GAGT C C C GCAGAGAGAT GAT C CGGAT T C T CAAGGAT CT GAAGCAAAAA 

III I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1207 C AAGAT GATGAAGAAGCCAGGCGAGAAAT GGCTAGGATT CTGAAGGAACTCAAGCAGAAG 1266 

979 CAC C C AGAGAAGGACT T AGAT C AGCTGGT GGAGAT GGC CAATT ACT AT GCT CT TT CC CAC 1038 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I II 

1267 CAT C C AGAGAAGGAAAT AGAGCAATTAAT AGAAT T AGCCAATT AC CAAGT CTT AAGT C AG 1326 

1039 CAACAGAAGAGC C GC G CCTT CT AC C GT AT CCAAGC CACT CGT AT GAT GACT GGT GCAG GC 1098 

II II II II II II II I I I I I I I I I I I I I II II I I I I I I I II I I I I I I 

1327 CAGCAAAAAAGT C GAGC GT T T TAC C GT AT TCAAGCT AC C C GC CT GAT GACC GGAGCAG GC 1386 
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1099 AAT AT C CT GAAGAAAC AT GCAGC AGAACAAGCCAAGAAGGCCT C C AGCAT GAGCGAG GT G 1158 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

1387 AACATTTTAAAGAGGCAT GCAGCAGACCAAGCCAGGAAAGCTGTCAGCATGCATGAGGT C 144 6 

1159 CAC AC C GAT GAGCCT G AGGACTTTATTTCCAAGGTCTTCTTTGACCCATGTTCTTAC 1215 

I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I III 

1447 AAC AC GGAAGT GGCT GAAAAT GAC CCT GT CAGTAAGAT CT TCTT T GAACAAGGGAC AT AT 1506 



1216 C AGT GC CT GGAGAACT GT G GGGCT GT ACT CCT GACAGT G GT GAG GAAAGGGGGAGACAT G 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1507 C AGT GT CT GGAGAACT GT GGC AC AGT AGC C CT GAC CAT TAT C C GCAGAGGT GGT GAT T T G 



1275 



1566 



1335 



1276 T CAAAGAC CAT GT AT GT GGACTACAAAAC AGAGGAT GGTT CT GC CAAT GCAGGGGCT GAC 

I II II III III II II II II III I I I I III I III II III I I till 
1567 AC CAAC ACT GT GTT T GT T GACT T CAGAACAGAGGAT GGC ACAGC CAAT GCT GGAT CT GAT 1626 



1336 



1395 



TAT GAGTT C AC AGAGGGC AC GGT GGT T CT GAAGC CAGGAGAGAC C CAGAAGGAGTT CT C C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1627 TACGAATTTACCGAAGGAACTGTGGTCTTTAAGCCTGGTGAGACCCAGAAGGAAATCAGA 1686 



1396 



1455 



GTGGGC AT AATT GAT GAC GAC ATTT TT GAGGAGGATGAACACT T CTTT GTAAGGT T GAG C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1687 GTT GGC AT CAT TGAT GAT GAC AT CT TT GAGGAGGAT GAGAAT TT C CT T GT GCAT CT CAGC 1746 



1456 



1515 



AAT GT C C GCAT AGAGGAGGAGCAGCCAGAGGAGGGGAT GC CT CC AGCAAT AT T CAACAGT 
I I I I I II III I I I I I I I I I I III I I I I 

1747 AAC GT CAAAGT AT CT T T GGAAG CCT C G GAAGAC GGCAT C CTGGAAGC CAGT 1797 



1516 



1575 



CTTCCCTTGCCTCGGGCTGTCCTAGCCTCCCCTTGTGTGGCCACAGTTACCATCTTGGAT 
II II II III II I I I I I I I I I I I I I I I II II I I I I I 

1798 CATGTCTCTACCCTTGCTTGCCTGGGATCCCCCTCCACTGCCACCGTGACTATTTTTGAT 1857 

1576 GAT GAC CAT GC AGG CAT CT T C ACT T TT GAAT GT GAT ACT ATT CAT GT CAGT GAGAGT ATT 1635 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I 

1858 GAT GAC CAT GCT GGCAT CTTT ACTTTT GAGGAAC C GGT GACT CAT GT GAGT GAGAGC ATT 1917 



1636 



1695 



GGTGTTATGGAGGTCAAGGTTCTGCGGACATCAGGTGCCCGGGGTACAGTCATCGTCCCC 
II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1918 GGCAT CAT GGAGGT GAAAGT T CT GAGAACAT CT GGAGCAC GT G GAAAT GT TAT C GTT CC C 1977 



1696 



1755 



TTTAGGACAGTAGAAGGGACAGCCAAGGGT GGCGGTGAGGACTTT GAAGACACATATGGG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1978 T ATAAGAC CAT T GAGGG GAC C GC C AGAGGT GGAGGGGAGGACTT T GAGGACACAT GC GGA 2037 

1756 GAGTT GGAATT CAAGAATGATGAAACT GTGAAAACCATAAGGGTTAAAATAGTAGAT GAG 1815 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2038 GAGCT CGAGTT CCAGAATGACGAAATT GTCAAAACAAT AT CAGT CAAGGTAATTGAT GAT 2097 

1816 GAGGAAT AC GAAAG GCAAGAGAAT T T CT T C ATT GCCCTTGGT GAACC GAAAT GGAT G G — 1873 

I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

2098 GAGGAGT AT GAGAAAAACAAGAC CT T C T T C CTT GAGAT T GGAGAGCC CCGC C T GGT G GAG 2157 

1874 AACGTGGAA 1882 

I I I I I 

2158 ATGAGTGAGAAGAAAGCCCTGTTATTGAATGAGCTTGGTGGCTTCACAATAACAGGGAAA 2217 



1883 TAT C AGAT GT GACAGACAG- 



1901 
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I I I I I I 1 1 I I 

2218 T AC CT GT ATGGCC AGC CT GT CT T CAGGAAAGTT CAT GCTAGAGAAC AT C CACT C C C CT CT 2277 

1902 GAAGCTGACTATGGAAGAAGAG 1923 

I II I I I I I I II I I I 
2278 ACT AT AAT CAC CAT CG CAGATGAAT AT GAT GACAAGCAGC CACT GAC C AGCAAAGAGGAG 2337 

1924 GAGGCCAAGAGGATAGCAGAGAT GGGAAAGCCAGT ATTGGGT GAACACCCCAAACT AGAA 1983 

III I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

2338 GAAGAGAGGC G CAT T GCGGAAAT GGGGC GC C CCATT CT GGGAGAGCAC AC C AGACT GGAG 



2397 



1984 GT CAT CATTGAAGAGT CCT AT GAGTT CAAGACT ACG GT GGACAAACT GAT CAAGAAGACA 204 3 

II I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I 
2398 GT GAT CATTGAAGAAT CCT AC GAGTT CAAGAGTACCGT GGACAAACT GATTAAGAAGACA 2457 

2044 AACCTGGCCTTGGTTGTGGGGACCCATTCCTGGAGGGACCAGTTCATGGAGGCCATCACC 2103 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2458 AACCT AGC C CT C GT GGTT GGGAC GAACAGCT GGAGAGAGC AGT T CAT C GAGGC GAT CACT 2517 

2104 GT CAGT GC AGCAGGGGAT GAGGAT GAGGAT GAAT C C GGGGAGGAGAGGCT GC C CT C CT GC 2163 

I I I I I I I I I I Mill I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I 
2518 GT CAGT GCT GGGGAAGAT GAC GAT GAC GAC GAAT GT GGGGAGGAGAAGCT GC C CT C CT GT 2577 

2164 T T TGACT ACGT CAT GCACTT CCT GACT GT CT T CT GGAAGGT GCT GT T T GC CT GT GT GCC C 2223 

I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I II I I I I II II I I I I III III 
2578 TTTGACTACGTGATGCACTTTCTGACTGTGTTCTGGAAGGTCCTCTTCGCCTTTGTCCCC 2637 



2224 



2283 



CCCACAGAGTACTGCCACGGCTGGGCCTGCTTCGCCGTCTCCATCCTCATCATTGGCATG 

II I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I II III I 
2638 C C GAC AGAGT ACT GGAACGGCT GGGC GT GTT T CAT C GT CT C CAT CCT CAT GAT C GGCCT A 2697 

2284 CTCACCGCCATCATTGGGGACCTGGCCTCGCACTTCGGCTGCACCATTGGTCTCAAAGAT 2343 
II II II I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I II II III 
CTGACGGCTTTCATTGGAGACCTCGCTTCCCACTTCGCCTGCACCATCGCCCTGAAGGAT 



2698 



2757 



2344 TCAGTCACAGCTGTTGTTTTCGTGGCATTTGGCACCTCTGTCCCAGATACGTTTGCCAGC 2403 

II II II II II II I I I I I II I I I I I I I I I II I I I I I II I I I I I III 
2758 TCCGTGACCGCGGTGGTGTTCGTTGCGCTTGGAACCTCAGTGCCAGACACATTTGCAAGC 2817 

2404 AAAGCTGCTGCCCTCCAGGATGTATATGCAGACGCCTCCATTGGCAACGTGACGGGCAGC 2463 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2818 AAAGT GGCC GC CAC CCAGGACCAGT AT GC GGATGCAT C CAT AGGT AAC GT CAC AGGCAG C 2877 

24 64 AACGCCGTCAATGTCTTCCTGGGCATCGGCCTGGCCTGGTCCGTGGCCGCCATCTACTGG 2523 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2878 AACGCGGTGAACGTCTTCCTGGGCATCGGTGTGGCCTGGTCCATCGCCGCCATCTACCAC 2937 

2524 GCTCTGCAGGGACAGGAGTTCCACGTGTCGGCCGGCACACTGGCCTTCTCCGTCACCCTC 2583 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2938 GCGGCCAACGGGGAACAGTTCAAAGTGTCCCCTGGCACGCTAGCTTTTTCTGTCACTCTC 2997 



2584 TTCACCATCTTTGCATTTGTCTGCATCAGCGTGCTCTTGTACCGAAGGCGGCCGCACCTG 2643 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

2998 TTCACCATTTTTGCTTTCATCAATGTGGGGGTGCTGCTGTATCGGCGGAGGCCAGAAATT 3057 

2644 GGAGGGGAGCTTGGTGGCCCCCGTGGCTGCAAGCTCGCCACAACATGGCTCTTTGTGAGC 2703 
I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 3058 GGAGGTGAGCTGGGTGGGCCCCGGACTGCCAAGCTCCTCACATCCTGCCTCTTTGTGCTC 3117 



Qy 2704 CTGTGGCTCCTCTACATACTCTTTGCCACACTAGAGGCCTATTGCTACATCAAGGGGTTC 2763 

I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I 

Db 3118 CTGTGGCTCTTGTACATTTTCTTCTCCTCCCTGGAGGCCTACTGCCACATAAAAGGCTTC 3177 

Qy 2764 TAA 2766 

III 

Db 3178 TAA 3180 
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